Phylogenetic Analysis Flashcards

1
Q

Was sind “leaves”,”nodes”,”root” und “branches”? In einem Stammbaum

A
Leave= sind die Zweigenden
Nodes= die Abzweigungen
Branches= die Äste
Root= Vorfahr
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist das Newick Format der Stammbäume?

A

Das klassische Eckige Format

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist der Unterschied zwischen true und inferred tree?

A

True ist der Evolutionär richtige und inferred ist der nach Daten richtige, sie müssen aber nicht immer das gleiche sein

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was sind die 5 Schritte um einen phylogenetischen Stammbaum zu bauen?

A
  1. Homologs finden
  2. Multiple sequence alignment
  3. Building Tree
  4. Statistical assessment of a tree
  5. Viewing a tree and drawing conclusions
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wie findet man die Sequence similarity raus?

1.Schritt

A

Mit Blast Databases wie NCBI/PFAM durchsuchen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist der Unterschied zwischen einem Gene Tree und einem Species Tree?

A

Nur weil ein Gen sich ändert heisst das nicht dass sich direkt die ganze Art aufteilt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wie geht man Schritt 2. Multiple Sequence Alignment an?

A
  • mit Dynammic Programming (No nach S)
  • Progressive Alignment
  • interative Alignment
  • Statistical Modeling
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist das Problem des multiple dynamic programming?

Was ist die Lösung dafür?

A

Die Zeit, 8 Sequenzen mit der länge 100 würden 81 Jahre dauern
Lösung: Progressive Alignments

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wie funktioniert progressive Alignment?

Worauf muss man achten?

A

Es Alignt die engsten Verwandten Sequenzen und added dann nach und nach die weniger verwandten Sequenzen => Anfangssequenz muss stimmen, sonst Fehler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie heisst das schnellste Progressive Alignment Programm?

A

MAFFT (ClustalW/T-Coffee)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie funktioniert das progressive Alignment Programm ClustalW?

A

Mit einem neighbour Joining tree (distance Matrix)

Das Alignment geschieht Paarweise, also an beide Seiten wird eine neue Sequenze gesetzt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist der Unterschied ziwschen Chracter-based und distance-based Methods im 3.Schritt, der Tree Erstellung?

A

Character based nutzen die Sequenz, also jeden einzelnen Character

Distance-based nutzen paarweise die verschiedenen Buchstaben, betrachten also nicht die Sequenz als Ganzes und benutzen die entstehende Matrix

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist eine p-distance?

A

Die durchschnittliche Unterschieldichkeit der betrachteten Sequenzen
(Anzahl Unterschiedliche Nukleotide geteilt durch Gesamtanzahl an betrachteten Nukleotiden)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist das Gute an Clustering algorithms, was das schlechte?

A

Gut: Geschwindigkeit
Schlecht: Singulary trees die Sternförmig und dadurch schwer vergleichbar sind, außerdem bestimmt der algorithmus die Tree criterions.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wie funktionieren optimality approaches?

A

Entweder mit Character oder Distance criterions.

Criterion (zb minimum branch lengths, fewest number of events, etc.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist bei der Distance Method zu beachten?

A

Man nimmt an das jede Veränderung direkt kam und nur 1 mal

Falls fehlerhaft kann der branch ins negative gehen

17
Q

Was ist das Kriterium, was die Vor- und Nachteile von Minimum Evolution?

A

Distances/Optimallity criterion
Der Tree mit der geringsten Gesamtlänge an Ästen wird ausgewählt

Pro:

  • objektiv-vergleichbar
  • schneller als Character based

Kontra:

  • Informationsverlust, weil Nukleotide in Distances umgewandelt werden
  • langsamer als Cluster
18
Q

Was ist das Kriterium, was die Vor- und Nachteile von Clustering Methoden (UPGMA und NJ)?

A

Distance und Cluster
KEIN Kriterium

Pro

  • fastest methods
  • therefore good for large datasets

Kontra
-Similarity und relatinship sind nicht zwangweise das gleiche, also kommt nicht zwangsweise ien evolutionary tree heraus

19
Q

Wovon geht UPGMA aus?

Wie funktioniert es?

A

Von einer constant molecular clock (rate of evolution)

nimmt die 2 Ähnlichsten, bildet einen Wert der dann mit dem dritten verglichen wird usw..

20
Q

Wie funktioniert NJ?

A

Sternförmige Anordnung, startet also nicht mit den 2 Ähnlichsten

21
Q

Was ist das Kriterium, was die Vor- und Nachteile von Parsimony Methods?

A

Criterion/Character

Kriterium:
Der tree mit den wenigsten SUbstitutionen etc ist der richtige

Pro:

  • simple, intuitive and logical
  • can be used on Genes and Phäno

Kontra:

  • Kann durch viele Events verfälscht werden, zb 2 Substitutionen ergeben Urzustand
  • langsamer
22
Q

Was ist das Kriterium, was die Vor- und Nachteile von Maximum Likelihood?

A

Charakter/Creiterion

Modell liegt zu Grunde
Zahlen x Modelprobability

Pro:
-most consistent

Kontra:

  • nicht so intuitiv
  • Kann verfälscht werden durch homoplasy (soppelsubstitution)
  • wenn Modell falsch dann tree falsch
  • sehr langsam
23
Q

Was ist Homoplasy?

A

Mehrere Nukleotid Events die wieder beim Ausgangszustand enden!

24
Q

Was ist das Kriterium, was die Vor- und Nachteile von Bayesian Inference?

A

Basiert auf Bayes’ theorem+

Pro:

  • berechnet die phylogenetische unsicherheit
  • sehr komplexe Modelle darstellbar
25
Welches ist der meiste, in Schritt 4., genutzte statistische Test um einen erstellten Tree zu testen? Wie funktioniert er?
Bootstrap: Die kleine Zahl an den branches in Prozent, wie oft kam das Ergebnis raus wenn man Statistisch random Schritte wiederholt (ist es realistisch?)
26
Was sind die größten Probleme der Phylogenetischen Analyse?
Einige Genevents sind schwer einzubeziehen (unequal crossing over, Viren etc.)