Module 3 : les techniques de séquencage et d'assemblage Flashcards

(70 cards)

1
Q

Nomme un objectif en bioinfo qui est au cœur de la biologie moléculaire

A

Obtenir la séquence des bases des molécules d’ADN

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quelle caractéristique fondamentales ont en commun les nouvelles méthodes de séquencage par rapport aux méthodes antérieures?

A

Elles produisent plus de données à moindre couts

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelles sont les applications du NGS en génomique?

A
  • Séquencage de novo
  • Re-seq de génome connus pour y détecter des variations genetique
    • mutations + polymorphisme
    • Seq de l’ADN ancien
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vrai ou faux

Lorsqu’un génome est séquencer de nouveaux, l’entiereté du génome doit être séquencer

A

Faux,
Possible de re-seq des régions ciblées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

À quoi sert le RNA-seq

A

Cherche à quantifier l’expression des transcrits en séquencant directement l’ADNc généré à partir d’ARNm

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelle méthode a été remplacer par la RNA-seq?

A

biopuces à ADN (microarrays)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Que permettent les méthodes de NGS en épigénomique?

A

Cartographier à haute résolution les interactions entre des facteurs de transcription et de l’ADN

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles méthodes combine la ChIP-seq?
Qu’est ce que cette méthode identifie?

A

immunoprécipitation de la chromatine et NGS
identifier les sites actifs de la transcription

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Pour quoi sont utilisées les NGS en métagénomique?

A

Explorer la diversité microbienne d’échantillons les plus divers

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quel est le lien entre méthode de séquencage et d’assemblage?

A
  • assemblage intimement lié aux stratégies et technologies de séquencage
  • Les algorythme des programmes d’assemblage ont du s’adapter aux nouvelles technologies de séquencage
    -Dev d’algoryhtme radicalement différents
    -Courte taille des séquences
    • Grand nombre de séquences produites
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Donne les étapes d’alignement de séquences et leur ordre de volume de données (plus grans au plus petit)

A

traitement de l’image 1
Données d’intensité 3
Données pour chaque base et scores de qualité 4
Alignement 2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Pourquoi la bio-info est-elle utile pour l’alignement des séquences?

A

Les méthodes NGS produisent une énorme quantité de données qu’il est impossible d’analyser/traiter sans l’aide d’outils informatique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quelle méthode de nouvelle génération n’utilise pas de polymérase?
Cette méthode utilise quoi au lieu de la polymérase?
Pourquoi la polymérase est-elle essentielle pour les autres méthodes?

A

SOLiD
Ligase
Impossible de lire directement la séquence d’ADN sans faire la synthèse du brin complémentaire avec une amorce

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vrai ou faux pour que les technologies NGS fonctionnent l’ADN doit être fixée sur un support solide

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Ces technologies reposent sur des réaction de séquencage _____. Elles intègrent des mécanismes de …

A

Cyclique
de gestion automatisée des fluides

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vrai ou faux
Les technologies NGS font des séquences de taille supérieur à la méthode sanger

A

Faux,
Contraire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Comment se fait la détection des réactions chimiques pour les NGS

A

par imagerie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quelles sont les étapes principales du séquencage à haut-débit?

A
  • Préparation des échantillons d’ADN
  • Immobilisation sur support solide
  • Séquencage
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Comment sont appelés les séquences définies ajoutées aux extrémités de fragments d’ADN lors de la préparation d’échantillons d’ADN?

Vrai ou faux
les fragments d’ADN sont par la suite brisées de manière symétrique

A

Adaptateurs

Faux,
préalablement brisés de manière aléatoire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

À quoi servent les adaptateurs?

A

À ancrer les fragments d’ADN à une surface solide et à définir le site ou la réaction de séquencage aura lieu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Vrai ou faux
Il est souhaitable que les fragments d’ADN soient de tailles différentes
Explique

A

Faux, de taille semblable (400 pb ou +) parce que il est souhaitable pour le programme d’assemblage de connaitre la distance approximative séparant deux séquences issus du même fragments (paired-end)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Quelles sont les trois principales approches pour ajouter des séquences adaptatrices?

A
  • Adapter ligation
    -Circularization et redigestion
  • Adapter ligation
    -> voir 3.1 diapo 8
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Vrai ou faux
La grande majorité des technologies de séquencage nécessitent une étape d’amplification pour former des regroupement de molécules clonales.

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Sur quoi sont fait les clusters?

A

sur un support solide comme une lamelle ou des microbilles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
L'étape d'amplification est indispensable pour...
rendre détectable les signaux émis par les fluorophore
26
L'étape d'amplification peut se faire dans quels milieux?
in situ, dans une émulsion ou en solution
27
Quelles technologies utilisent la PCR par émulsion?
454 et SOLiD
28
Quelle technique dMaplification utilise la technologie illumina?
Bridge PCR
29
Quelle approche utilise la compagnie CGA pour l'amplification?
amplification par cercle roulant
30
Comment sont appeler les reésultats d'amplification par cercle roulant?
DNA nanoballs
31
Décrire brievement la technologie SMRT de PACBio
Les complexes former des AND polymérases et des fragments d'ADN sont immobilisées au fond de chambres microscopiques appellées ZMW
32
À quoi fait appel la technologie 454 pour produire de la lumière?
à la luciférase
33
Comment la technologie SOLiD utilise la lumière?
utilise une ligase pour ajouter de cours oligonucléotides fluorescents.
34
Des cycles de ____, de _____ et de _____ sont répétés pour construire la séquence d'ADN
d'incorporation, de lavage et d'imagerie
35
Vrai ou faux La première technologie de séquencage à haut-débit est Illumina
Faux, 454
36
Comment fonctionne la technologie 454?
- ADN fragmenté en morceaux de 300-1000 pb et séparer en molécule simple brin - adapteurs spécifiques liés aux fragments d'ADN - Fragments d'ADN amplifier par émulsion par PCR un seul fragments par microbille. isoler les une des autres dans de minuscules réacteurs formés par une émulsion d'huile et de mélange réactionnel - Émulsion brisé, ADN dénaturé et microbille contenant les molécules clonales se retrouvent en phase solide -Ajout de plus petites microbilles contenant les enzymes nécessaire à la réaction de pyroséquencage
37
Vrai ou faux À la fin de la réaction d'émulsion par PCR on retrouve sur chaque microbille une dizaine de milliers de copies d'un fragment d'ADN spécifique
Faux, Dizaine de millions
38
Quelle étape de la technologie 454 peut mener à des erreurs?
l'émission de lumière par la sulfurylase et la luciférase. Parce que l'intensité du signal lumineux est proportionnel au nombre de nucléotide ajouté, donc en présence d'homopolymère plus difficile car intensité très haute.
39
Qu'est ce qi limite la taille des séquences pouvant être obtenues avec Illumina?
la qualité du signal diminue avec le nombre de cycles
40
Quelles sont les 12 étapes de la technologie Illumina?
1. préparer échantillons d'ADN 2. Fragments s'attachent de manière aléatoire sur la surface de la lamelle 3. Fragments se replient en U pour apparier leurs extrémités libres à des oligonucléotides complémentaire 4. oligo complémentaire attaché à la surface allongé par l'ADN pol 5. Cycle répétés d'amplification et dénaturation 6. Formation de clusters 7. ajout de nucléotides fluo et excitation 8. Image à haute résolution de la lamelle 9. initiation d'un second cycle de séquencage 10. Acquisiation d'une seconde image à haute résolution 11. Répétition du cycle 12. alignement des données sur un génome de référence et identification des variations génétiques
41
Décrire la flow cell de la technologie Illumina
Cette plaque est tapissée d'oligonucléotides complémentaires aux adaptateurs qui sont ajoutés lors de la préapartion de la librairie de séquençage.
42
Quelle modification a été apportée aux nucléotides dans la technologie Illumina?
grp protecteur fluo à leur extrémité 3'-OH -> pas possible d'ajouter plus d'un nucléotide par cycle
43
Vrai ou faux Les groupement protecteur doivent être clivés enzymatiquement après chaque cycle de Illumina
Vrai
44
Pourquoi est-il nécessaire d'assembler les séquences?
-Parce que les réactions de séquencage in vitro ne sont pas capable de répliquer le génome en entier -> Les lectures produites par les réactions enzymatiques de séquencage sont très courtes -> les génomes comptent des millions de pb chez les bactérie et des milliards chez les eucaryotes
45
Qu'est ce qu'un assemblage?
structure de données de séquence hiérarchisées en une reconstruction possible d'un génome
46
Quel est le plus gros défi de l'assemblage de séquence?
Mettre en ordre des dizaines de millions de courtes séquences d'ADN issues de la fragmentation d'un génome
47
Quelles sont les deux approches pour l'assemblage de génome? quelle est la plus utilisée?
hiérarchique et shotgun (WGS) WGS
48
Définir reads
Courtes séquence d'ADN issues de réactions enzymatiques de séquencage (935-1000 pb)
49
Définir contig
Séquence génomique continue résultant de l'assemblage des reads
50
définir scaffolds
Ensemble de contigs dont l'orientation et la taille des brèches sont connues
51
Quelle est la différence entre les single ends et les paired ends?
single ends: correspondent aux séquences provenant d'une seule extrémité d'un fragment d'ADN paired ends: courtes séquences situées aux extrémités d'un même fragment d'ADN génomique dont la taille approximative est connues
52
Vrai ou faux la qualité des assemblages avec la méthode sanger est meilleure que celle avec les NGS
Vrai
53
Quels programmes sont concus pour l'alignement de séquence avec un génome de référence?
Maq, Bowtie et BWA
54
Combien de mésappariements sont allouées pour des reads de 36 pb?
1 ou 2
55
Selon quoi le nombre de mésappariement allouées peut varier?
Selon le score de qualité des bases environnantes
56
quel pourcentage des séquences peuvent être alignées à partir des données brutes?
50-80
57
Pourquoi n'est-il pas possible d'aligner 100% des séquences?
erreurs de séquencage reads s'alignent à plusieurs endroits dans le génome différence importante existe avec le génome de référence
58
Vrai ou faux le pourcentage de reads positionnés sur le génome fournit un bon indice de la qualité des données de séquences
Vrai
59
Quelle technique est utilisée pour l'assemblage de novo?
algorythme d'approximation découlant de la théorie des graphes
60
Quels sont les 2 critères majeurs lors de l'évaluation de la qualité des assemblages?
la taille et l'exactitude des contigs et des scaffolds
61
À quoi correspond la couverture du génome?
% de nucléotides d'un génome de référence présent dans les contigs assemblés
62
Quelles données sont importantes lors de l'évaluation de la qualité de l'assemblage?
la taille et l'exactitude des contigs et des scaffolds La taille maximale, la taille médiane et la taille moyenne des contigs
63
Vrai ou faux Dans un assemblage il est souhaitable que les contigs soine t de taille plus petites et plus nombreux
Faux, moins nombreux et plus long pour autant que des erreurs ne soient pas introduites
64
Qu'est ce que le N50?
taille du plus petit contigs parmis ceux dont la taille combinée représente 50% de l'assemblage
65
Vrai ou faux Plus le N50 est petit, meilleure est la qualité de l'assemblage
Faux, plus il est élevé
66
Vrai ou faux le traitement des séquences répétées représente le défi principal de l'assemblage
vrai
67
Résoudre les problèmes d'assemblage passe par...
l'augmentation de la taille des reads
68
Quelle approche est employée par les algorithme de première génération (gourmands)?
Dans un premier temps, toutes les paires de reads sont comparées les unes aux autres. Celles qui se chevauchent le plus sont jointes en premier. Pour tenir compte des erreurs de séquençage et des polymorphismes, les chevauchements sont calculés avec une variante de l'algorithme de Smith-Waterman qui admet de petites différences entre les séquences, entre 1 et 10%. Par la suite, les reads avec les chevauchements les plus longs sont joints pour former des contigs. Ce processus est répété, à chaque fois en joignant les séquences présentant le chevauchement avec le score le plus élevé jusqu'à ce que tous les chevauchements soient épuisés.
69
Dans quel cas les algorithmes de première génération posent problème?
Lorsque la taille des répétitions excède la taille des reads
70
Quelles sont les étapes des assembleurs de nouvelles génération?
1. Détection des erreurs et correction selon la composition des reads 2. Contruction d'un graphe pour représenter les reads et les séquences qu'elles partagent 3. Réduction des chemins qui ne se croisent pas à des noeuds uniques dans le graphe 4. suppression des chemins erronés 5. Fusion de la complexité engendrée par les polymorphismes 6. Simplification des enchevêtrements grâce à de l'information externe au graphe : read paired-end 7. Conversion des chemins réduits en contigs et en scaffolds 8. Réduction de l'alignement à une séquence consensus