test 1 Flashcards Preview

zzz..... uni......Bioinformatics > test 1 > Flashcards

Flashcards in test 1 Deck (13):
1

Sie benötigen eine Score Matrix, geeignet für lokale Alignments von RNA Sequenzen. Welche Eigenschaften erwarten Sie von den Scores?

Der erwartete (mittlere) Score für ein Paar zufällig ausgewählter Nukleotide ist negativ

Der score s(C,U) = s(U,C)

2

Welche Aussagen zu Semi-globalen Alignments sind richtig?

Wählen Sie eine oder mehrere Antworten:
a. Haben nie mehr als eine optimale Lösung
b. Ignorieren Anfangs- und End-gaps
c. Sind sinnvoll für Sequenzen mit vielen Punktmutationen
d. Der optimale Score steht immer rechts unten in der DP-Matrix

Ignorieren Anfangs- und End-gaps

3

Welche Aussagen zum Smith-Waterman-Beyer Algorithmus treffen zu?

Wählen Sie eine oder mehrere Antworten:
a. Ein Alignment nach Smith-Waterman-Beyer ist heuristisch
b. Gapkosten können nach verschiedenen Modellen berechnet werden
c. Die Sequenzen werden global aligniert
d. Der Algorithmus hat eine quadratische Laufzeit

Gapkosten können nach verschiedenen Modellen berechnet werden,

Die Sequenzen werden global aligniert

4

Welche der folgenden Aussagen sind richtig?

Wählen Sie eine oder mehrere Antworten:
a. Freie end-gaps sind nützlich für sehr unterschiedlich lange Sequenzen
b. Alignment mit affinen Gapkosten führt zu kürzeren, dafür mehr Gaps
c. Lokale Alignments werden immer mit Ähnlichkeits- (similarity-) Scores berechnet
d. Lokale Alignments beginnen und enden nie mit einem Match.

Lokale Alignments werden immer mit Ähnlichkeits- (similarity-) Scores berechnet,

Freie end-gaps sind nützlich für sehr unterschiedlich lange Sequenzen

5

Warum benötigt man eine ganze Serie von Scoring Matrizen? (z.b. BLOSUM50, BLOSUM60, etc.)

Um nah bzw. entfernt verwandte Sequenzen zu alignieren

6

Welche Aussage(n) zu BLOSUM-Matrizen treffen zu?
Wählen Sie eine oder mehrere Antworten:
a. BLOSUM-Matrizen mit niedriger Nummer eignen sich für fern verwandte Sequenzen
b. Eignen sich nicht für lokale Alignments
c. Leiten sich von einer Sammlung homologer Proteine ab
d. Ein Eintrag in der Matrix ist die Wahrscheinlichkeit einer Substitution

BLOSUM-Matrizen mit niedriger Nummer eignen sich für fern verwandte Sequenzen, Leiten sich von einer Sammlung homologer Proteine ab

7

Ein paarweises Alignment mit ihrer neuen Implementation des Smith-Waterman Algorithmus benötigt für zwei Sequenzen der Länge 1000 nur ca. 3 Sekunden Rechenzeit und 4MB Speicher.
Was erwarten Sie ca. für zwei Sequenzen der Länge 3000?

27 Sekunden, 36MB Speicher

8

Welcher Algorithmus eignet sich optimal für die Berechnung von Alignments mit affinen Gap-Kosten?
Wählen Sie eine oder mehrere Antworten:
a. Gotoh
b. BLAST
c. Smith-Waterman
d. Needleman-Wunsch

Gotoh

9

Was trifft auf Dynammic Programming zu?

Wählen Sie eine oder mehrere Antworten:
a. passt die Rechengeschwindigkeit dynamisch der Problemgröße an
b. tabelliert Zwischenergebnisse
c. baut optimale Lösungen aus der Lösung kleinerer Subprobleme
d. ist eine Heuristik zur schnellen Berechnung von Alignments

tabelliert Zwischenergebnisse,

baut optimale Lösungen aus der Lösung kleinerer Subprobleme

10

Welche Aussagen zum FASTA-Algorithmus sind korrekt?

Wählen Sie eine oder mehrere Antworten:
a. Ist eine Heuristik
b. Für eine Query der Länge m und eine Datenbank der Größe n wächst der Aufwand mit O(n * m)
c. Findet mindestens 1 optimales Alignment
d. Arbeitet mit kurzen Alignment Seeds

Ist eine Heuristik,

Arbeitet mit kurzen Alignment Seeds

11

Sie haben die Nukleotidsequenz einer RNA isoliert. Welche BLAST-Variante würden sie benutzen um zu überprüfen ob es ein dazugehöriges Protein gibt?

BLASTX

12

Bei einer Datenbanksuche mit BLAST erhält man E- und P-values. Welche Aussagen sind richtig?

Wählen Sie eine oder mehrere Antworten:
a. Der E-value ist immer größer als der P-value
b. Je größer der E-value, desto signifikanter der Hit.
c. P-value und E-value sind unabhängig von der Größe der Datenbank
d. BLAST findet immer das optimale Alignment
e. Für P nahe 0 sind P und E fast gleich

Der E-value ist immer größer als der P-value,

Für P nahe 0 sind P und E fast gleich

13

Die meist gebrauchte Methode zum erstellen von multiplen Alignments ist das "Progressive Alignment".

Welche Aussagen sind richtig?
Wählen Sie eine oder mehrere Antworten:

a. Der "guide-tree" dient nur der Beschleunigung der Berechnung, aber beeinflußt nicht das Resultat.

b. Progressives Alignment berechnet paarweise profile-profile alignments um ein multiples Alignment zu erhalten.

c. Progressives Alignment liefert immer das multiple Alignment mit dem best-möglichen sum-of-pair Score

d. Der Rechenaufwand für r Sequenzen der Länge n liegt (ohne Berechnung des guide-trees) in O(r * n2)

e. Progressives Alignment ist eine Erweiterung des Needleman-Wunsch Algorithmus auf mehr als zwei Dimensionen. Für drei Sequenzen wird z.b. eine 3-dimensionale Matrix aufgefüllt.

Der Rechenaufwand für r Sequenzen der Länge n liegt (ohne Berechnung des guide-trees) in O(r * n2),


Progressives Alignment berechnet paarweise profile-profile alignments um ein multiples Alignment zu erhalten.