1. Le Séquençage des Acides nucléiques Flashcards

1
Q

Combien vaut l’intra ?

A

40 %

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Nomme-moi la méthode classique de séquençage.

A

La méthode de Sanger (par terminaison de chaîne didéoxy)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Nommez-moi les 2 méthodes de séquençage de 2e génération.

A
  1. Illumina

2. Ion Torrent (pyroséquençage)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Nommez les 2 méthodes de séquençage de 3e génération

A
  1. Pacific BioScience

2. Nanoparticules (Minion)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Nommez 2 raisons de séquencer

A
  1. Pour avoir des informations sur la séquences des acides nucléiques (génomique structurelle) ( actgactgactg)
  2. Pour quantifier les molécules d’ADN (génomique fonctionnelle) (10 séquences actg)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Définissez transcriptome

A

Transcriptome (transcrit + génome) : ensemble des ARN présents dans une cellule

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Définissez : Protéome

A

Protéome : L’ensemble des protéines exprimées dans une cellule

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Définissez : Sécrétome

A

Sécrétome : C’est l’ensemble des molécules organiques et inorganiques sécrétées par les cellules

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Définissez: Intéractome

A

Intéractome : L’ensemble de toutes les interactions dans la cellule

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Nommez 4 applications du séquençage :

A
  1. Recherche fondamentale (bio, microbiologie, écologie)
  2. Recherche clinique et médecine (Diagnostic mutation vs maladie)
  3. Expertise médico-légale (empreintes génétiques)
  4. Industrie agro-alimentaire (procédés bio-industriels)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Parlez-moi du projet de séquençage du génome humain.

A
  • Premier assemblage complet : 2003
  • Provenant de 4 individus ( 2 H + 2 F)
  • 12 ans de travail
  • 2,7 milliards de $ US
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Pourquoi dit-on que les techniques de 2e générations ont révolutionné le séquençage ?

A
  • Car elles permettent de séquencer énormément de séquences en même temps (baisse drastique du coût de séquençage)
    ~ 1 cenne pour 1 million de pb
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

De quoi est composé un ADN

A
  • Phosphate
  • Sucre (pentose)
  • Base azotée
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quel carbone sur le pentose d’une molécule d’ADN est essentiel et pourquoi ?

A

Le carbone 3 avec son hydroxyl (OH)! Permet la polymérisation de l’ADN 5’->3’

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelles sont les bases azotées retrouvées dans la nature ?

A
  1. Adénine (A)
  2. Thymine (T) (dans l’ADN seulement)
  3. Cytosine (C)
  4. Guanine (G)
  5. Uracil (U) (dans l’ARN seulement)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q
  1. Quelle enzyme permet la polymérisation de l’ADN ?
  2. Dans quel sens ?
  3. Décrire le processus de polymérisation
A
  1. ADN polymérase
  2. Synthèse 5’ —> 3’
  3. L’ ADN pol utilise un ADN matrice sur laquelle il y a une amorce d’ARN. L’amorce d’ARN présente une extrémité 3’ OH libre (hydroxyl) qui permet la polymérisation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Expliquez le PRINCIPE GÉNÉRAL de l’approche classique du séquençage de Sanger.

A

Séquençage de Sanger principe général :

  • C’est une méthode dans laquelle on polymérise le brin complémentaires de l’ADN à séquencer.
  • On ajoute un ddNTPs par tube.
  • Lorsqu’un ddNTPs est incorporé dans le brin nouvellement synthétisé, la polymérisation s’arrête car il n’y a plus de 3’OH (hydroxyl) libre.
  • À l’aide d’un gel d’électrophorèse on peut reconstituer la séquence.

P.S : il y a une autre question qui demande les étapes, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Décrivez-moi les étapes de la rx classique de Sanger.

A
  1. Préparer 4 tubes de polymérisation séparés. Chaque tube contient : tampon, ADN à séquencer, amorce (20nt) avec une étiquette , ADN pol. , les 4 dNTPs et 1 seul ddNTPS.
  2. La rx s’effectue ( l’ADN pol incorpore des dNTPS jusqu’à incorporer un ddNTPs = la polymérisation s’arrête car plus d’extrémité 3’ OH libre).
  3. Toutes les réactions en parallèle vont nous donner des séquences de différentes longueurs.
  4. Gel de polyacrylamide : résolution 1 pb (1 rx par puits = 4 puits)
  5. Révélation sur film (l’étiquette radioactive émet de l’énergie qui noircit le film)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Pourquoi Sanger a-t-il gagné 2 prix Nobel ?

A

1- 1958 : séquençage protéique, insuline

2- 1977 : séquençage d’ADN, bactériophage PhiX174

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Comment lit-on un audiogramme dans la méthode de Sanger ?

A
  • Le plus petits fragments migrent plus rapidement
  • On lit la séquence à partir du bas vers le haut.
  • On associe les bandes avec leur puits ( A,C,TG)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Vrai ou Faux (protocol moderne de Sanger)

  1. Le protocole moderne du séquençage de Sanger se fait désormais avec une polymérase thermophiles (comme la PCR).
  2. L’utilisation d’une T° plus élevée permet une meilleure hybridation et aussi une hybridation plus spécifique.
A
  1. Vrai

2. Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Vrai ou faux (protocol actuel du séquençage de Sanger)

  1. Au lieu de marquer l’amorce on marque les dNTPs avec une molécule fluorescente.
  2. Lorsque la polymérisation s’arrête, la fluorescence apparaît grâce au ddNTPS marqué.
  3. Les 4 rx se font dans 4 tubes séparés et ensuite elles sont chargées sur des gels à capillaires munis de détecteurs automatiques.
A
  1. Faux, on marque les ddNTPs
  2. Vrai
  3. Faux, se font dans 1 seul tube.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Séquençage de Sanger actuel :

  1. Tailles des séquences:
  2. Coût:
  3. Nombre de séquences par réactions:
  4. Taux d’erreur :
A
  1. Tailles des séquences: 500-1000 pb
  2. Coût: ~3$
  3. Nombre de séquences par réactions: 1
  4. Taux d’erreur : <0,5%
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Expliquez les méthodes de séquençage suivantes:

  1. Ordonnée
  2. Shotgun
A
  1. On coupe de génome en gros fragments appelé et ont les insères dans des YAC. On choisis les YAC les moins redondants et on les séquences par la méthode de Sanger. Méthode longue car on doit choisir les YAC.
  2. Séquençage au hasard du plus de fragments possibles. Les fragments finissent par se chevaucher et on peut donc faire l’assemblage au final de la séquence complète.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Quelles sont les deux techniques de séquençage de 2e génération ?

A
  1. Illumina

2. Ion Torrent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Qu’est-ce qu’une banque d’ADN ?

A

Banque d’ADN: C’est l’ensemble des fragments récoltés d’un seul échantillon insérés dans un vecteurs commun(ou avec des adapteurs commun).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Les bandes d’ADN peuvent être sous 2 formes, expliquez-les:
1.
2.

A
  1. Circulaire : Les fragments sont dans des vecteurs plasmidiques. Peuvent être transformé dans un organisme.
  2. Linéaire : Les séquences sont linéaires et ont des séquences adaptatrices aux extrémités qu’on appelle des adaptateurs. Ne peuvent pas être transformé dans un organisme. Peu simplement être amplifié par PCR.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Séquençage de 2e génération vrai ou faux :

  1. Permet le séquençage de millions de séquences (de manière simultanée)
  2. Dispendieux par réaction
  3. Possibilité de multiplexage (séquençage de plusieurs banques d’ADN entières)
  4. Donne des séquences courtes
    • Illuminate :150 b
    • Iron Torent : 400 b
A
  1. Vrai
  2. Vrai (mais réduit si on regarde coût/séquence)
  3. Vrai
  4. Vrai
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Quelles sont les méthodes d’amplification clonale de :

  1. Illumina
  2. Ion Torent
A
  1. Illumina : colonies d’ADN par bridge PCR

2. Ion Torent : amplification sur bille

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Parlez-moi des adaptateurs utilisés dans le séquençage de 2e génération.

A

Les fragments à séquencer sont entourés à chaque extrémité par ce qu’on appelle des adaptateurs. Ce sont des structures en Y qui contiennent :

  1. Des séquences pour hybrider l’amorce de séquençage
  2. Une séquence pour hybrider sur la matrice (bille/lame de verre)
  3. Une séquence index de 4-5 bases (permet l’identification du reads à une banque génomique précise)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Vrai ou faux

Dans le séquençage de 2e génération on utilise des amorces spécifiques pour polymériser un seul brin. Ça nous permet donc de représenter 1 seule molécule, mais dans les deux orientations.

A

Vrai ! Diapo 22, sujet 1 : séquençage des acides nucléiques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Vrai ou faux :

  1. Les adaptateurs en Y dans le séquençage de 2e génération permettent, après l’amplification d’avoir des séquences différentes à chaque bout.
  2. Les adaptateurs en Y aux extrémités sont importants pour séquencer 1 seul bout à la fois.
  3. Les capteurs en Y permettent aussi le séquençage des deux extrémités.
A
  1. Vrai
  2. Vrai
  3. Vrai
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Parle-moi de la séquence index contenu dans les adaptateurs.

A

Séquence index :

  • Séquence de 4-5 bases unique à une seule banque d’ADN
  • Elle permet de relier les reads à une bande d’ADN précise
  • Sert donc à l’identification lors du multiplexage.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

-Méthode Illumina-

Décrivez moi la méthode de en bref (séquençage par fluorescence).

A
  • Plaque de verre avec des oligonucléotides (complémentaires aux adaptateurs utilisés dans la banque d’ADN)
  • Les séquences d’ADN vont s’hybrider sur les amorces de la plaques de verre
  • L’hybridation permet la polymérisation d’ADNc
  • Le nouveau brin va s’hybrider sur une amorce voisine complémentaire
  • Amplification clonale : par PCR en pont
  • Formation de polonie
35
Q

Pourquoi appelle-t-on la formation de colonie par la méthode illumina des polonies ?

A

Car c,est des colonies obtenues par polymérisation (se sont des clones)

36
Q

Expliquez-moi les étapes de séquençage de la méthode illumina (comment perçoit-on la fluorescence) ?

A
  1. Blocage chimique réversible du bout 3’ OH. Le blocage permet de prendre une photo spécifique de la fluorescence émise ( chq Nt a une fluorescence spécifique).
  2. Incorporation d’une seule Nt à la fois par la pol.
  3. Photo des colonies prise à chaque cycle (1 colonie = 1 reads)
  4. Tx chimique = enlève la fluorescence et débloque le 3’ OH
  5. Répétition du cycle
37
Q

Quelle est la longueur des reads avec la méthode illumina ?

A

50-150 bases

38
Q

Décrivez-moi les 3 composantes des nucléotides modifiés utilisés dans la méthode Illumina.

A
  • Fluorophore clivable
  • Cicatrice
  • Terminateur 3’ réversible
39
Q

Quand on pense au nucléotide modifié utilisé dans la méthode Illumina, parlez-moi de

  1. Son fluoroscope clivable
  2. Sa cicatrice
  3. Son terminateur 3’ réversible
A
  1. Couleur spécifique selon Nt, lien clivable par TCEP (permet d’arrêter la fluorescence et d’éviter la contamination)
  2. La cicatrice permet de créer une distance entre la base et le fluor opposé pour ne pas nuire au travail de la pol.
  3. Permet d’arrêter la polymérisation pour un cycle, le TCEP permet de libérer le bout 3’OH
40
Q

Vrai ou faux (Illumina)

  1. C’est du séquençage pair-end (des deux extrémités)
  2. La séquence du milieu est connue grâce à cette méthode
  3. Une série d’étape enzymatique permettent d’inverser les fragments sur la lame de verre
A
  1. Vrai
  2. Faux, séquence du milieu inconnue
  3. Vrai
41
Q
  • Méthode Ion Torent - Méthode de séquençage de 2e génération

Expliquez-moi cette méthode en 5 étapes simplifiées

A
  1. Banque d’ADN avec adaptateurs en Y
  2. Amplification clonale des séquences sur billes
  3. Méthode de microfluidique pour obtenir 1 bille/1 fragment par puits
  4. Séquençage par vague de Nt et polymérisation
  5. Détection du chmt de pH en lien avec l’ajout de Nt
42
Q

Qu’est-ce que l’approche de PCR par émulsion (incluant la microfluidique) ?

A
  1. Mélange d’huile avec la solution contenant les fragments à séquencer. Dilution du mélange pour résulter en microgouttelette. Ça permet d’isoler une seule bille avec un seul fragment d’ADN en suspension dans l’huile.
  2. Amplification par PCR
  3. Chaque bille isolé contient de multiples copies du même fragment d’ADN (clones)
43
Q

Qu’est-ce qui permet dans la méthode Ion Torrent de détecter la polymérisation

A
  1. On incorpore un seul type de Nt à la fois.
  2. Lorsque la pol. incorpore un Nucléotide = relâchement d’un proton.
  3. Ce proton relâché entraîne une baisse temporaire de pH (qui est détectable)
  4. Nt incorporé et le pH change = ce Nt est dans la séquence.
  5. Changement de pH proportionnel au nombre de Nt ajouté.
44
Q

Quelle est la taille des reads avec la méthode Ion Torent ?

A

200-400 bases

45
Q

Quel est l’inconvénient majeur de la méthode Ion Torrent ?

A
  • Le taux d’erreur est plus élevé dans les séquences répétées (surtout à partir de 8 Nt de suite)
  • À cause de la limite de résolution du pHmètre
46
Q

Comparatif Illumina et IonTorent
Répondez pour chacune:

  1. Nombre de séquences/lignes
  2. Séquences seule ou en paire
  3. Tailles des séquences
  4. taux d’erreur
  5. Coût de la rx
  6. Temps de récole de l’échantillon
A

Illumina Iron Torent

  1. 200 millions/lignes. 70 million/lignes
  2. Seules ou en paires. Séquences directes seulement
  3. 50-150 pb 200-400 pb
  4. <0,1%. < 1,8%
  5. Entre 800-3000$. 700$
  6. 3 jours - 1 sem. 2-3 jours
47
Q

Quelles sont les 2 méthodes de séquençage de 3e génération ?

A
  1. Pacific Bioscience SMRT seq (Pac Bio)

2. Nanopore MinION

48
Q

Quels sont les principaux avantages du séquençage 3e gen. (peu importe la méthode). Nommez 3 avantages.

Nommez le principal désavantage.

A
  1. Pas d’amplification clonale nécessaire (rapide ++)
  2. Permet d’éviter le biais d’amplification
  3. Reads très longs (jsuqu’à 60kb)
  4. Pourcentage d’erreur élevé.
49
Q

Vrai ou faux

La méthode Pac Bio consiste en une polymérase fixée au fond d’un puits, proche d’un détecteur de fluorescence. À mesure qu’on ajoute et incorpore des Nt, on détecte la fluorescence.

A

Vrai

50
Q

Technique Pac Bio : taux d’erreur de combien ?

A

15%

51
Q

Technique Pac Bio :

Comment fait-on pour seulement voir la fluorescence d’une Nt, sans détecter de bruits de fond ?

A

Clivage du fluorophore lors de la rx. Ainsi, on clive le bout 5’ phosphate après la polymérisation = arrêt fluorescence (mais pas d’arrêt de synthèse).

L’utilisation d’un laser à très courte portée, ainsi qu’une polymérase fixée au fond minimise le bruit de fond et augmente la capacité de détection du fluorophore.

52
Q

Vrai ou faux - Pac Bio

  1. Il s’agit d’un méthode de polymérisation en temps réel, donc sans arrêt de synthèse et sans vague de Nt.
  2. On arrive a diminué le % d’erreur en utilisant plusieurs polymérase
  3. Le puits utilisé s’appelle une poche de catalyse
A
  1. Vrai
  2. Faux en relisant plusieurs fois la même séquence.
  3. Faux, poche catalytique
53
Q

Pac Bio

Qu’est-ce que la préparation de la banque SMRT ?

A

C’est la création d’une molécule circulaire avec le fragment à séquencer.
Ligation des adapteurs SMRTbell ainsi que l’ajout d’une amorce.
Ainsi, ça donne un sb replié sur lui-même.

54
Q

2 stratégies existes pour la méthode Pac bio, lesquelles ? Elles consistent en quoi ?

A
  1. Standard read
    - Lire de long fragments 25 000 - 100 000 bases
    - 1 seule fois
    - Taux d’erreur de 15%
  2. HIFI read
    - 25 000 bases / read
    - Duplication des tours
    - Plusieurs lecture de la même séquence
    - Diminution taux d’erreur !
    - Désavantage car fragments plus courts
55
Q

Pac Bio : un avantage, le temps de préparation court :))))) Pourquoi ?

A
  • Pas d’amplification clonale

- Résultats presque en temps réels

56
Q

Nanopore MinION

Expliquer grossièrement les étapes de cette technique de 3e génération.

A
  1. ADN capté par une enzyme qui la fait passer par un pore
  2. Quand l’ADN/ARN passe = perturbation du champ électrique
  3. Chaque base ajoutée possède une perturbation spécifique qui permet son identification en temps réel
57
Q

Quels sont les 4 avantages de la technique de 3e génération Nanopore MinION ?

A
  1. Moindre coût
  2. Permet de séquencer de longues séquences (dépends seulement de la capacité à garder la séquence intacte)
  3. Rapide
  4. Lecteur accessible (grosseur d’une clé USB)
58
Q

Quels sont les désavantages de la technique de 3e génération Nanopore MinION ?

A
  1. Un taux d’erreur élevé (~15% selon l’expérience)
  2. Moins grande quantité de reads/flowcell (1 million de reads) que Illumina ou Iron Torent, mais possibilité de faire jusqu’à 48 flowcell en même temps
59
Q

Vrai ou faux

La technique de 3e génération Nanopore- MinION est idéal pour identifier et découvrir de nouvelles espèces dans un échantillon.

A

Faux.

Seulement pour en identifier. Pas pour en découvrir de nouvelles.

60
Q

Dites les information suivantes sur Pac Bio et Nanopore MinION

  1. Reads/puce ou smart cell
  2. Séquences
  3. Tailles des séquences
  4. Taux d’erreur
  5. Coût d’une réaction
  6. Temps de récolte de l’échantillon
A

Pac Bio Nanopore MinION

  1. 4 millions de reads. 0,2-1 million de séquences/puce
  2. Séquences directes Séquences directes
  3. 500 -75 000 bp. Basé sur la capacité à garder les fragments intactes
  4. 1% (HIFI reads (relecture )) ~15% au mieux
  5. 700$ 100$
  6. 1 journée. Quelques minutes/heures
61
Q

Vrai ou faux

Les applications du Pac Bio de 3e génération sont :

  1. Séquençage de génome en combinaison avec 2e génération
  2. Identification d’ARN non-codants
  3. Identification de mutation chromosomique (translocation, inversion et duplication)
A
  1. Vrai
  2. Vrai
  3. Vrai
62
Q

Vrai ou faux

Les applications de MinION 3e génération ?

  1. Séquençage de novo
  2. Identification des espèces présentes dans un échantillon
  3. Science forensique
  4. Comptage de séquences d’ARN
  5. Puisque le taux d’erreur est peu élevé et qu’il est portatif, on l’utilise sur le terrain
A
  1. Faux, pas de séquençage de novo, plus de l’identification.
  2. Vrai
  3. Vrai
  4. Vrai
  5. Faux, taux d’erreur élevé ! Utilisation sur le terrain parce qu’il est portatif
63
Q

Pourquoi est-ce qu’on dit que l’acquisition et l’analyse des données est maintenant le défi majeur et la majorité des coûts ?

A

Analyser rapidement et à grande échelle les séquences est primordial. Des plateformes informatiques fortement équipées et des bioinformaticiens sont essentiels ($$$$).

64
Q

Quel language utilise les bioinformaticiens pour analyser les séquencer et les conserver sous forme de données ?

A
  • Alphabet des symboles informatiques (utilisé pour calculer le score) : ASCII
  • Des données binaires: format fichier texte ( ligne de code)
  • La qualité des séquençages est analysé à partir de bcp de paramètres et un % d’erreur. Plus le score est élevé et plus le % d’erreur est petit.
65
Q

Quel est le format de fichier de donnée le plus courant (analyse de séquençage)

A

Fastq

66
Q

En quoi consiste le format de données Fastq ?

A
  • Pour chaque reads= 4 lignes de code
  • Chaque symbole représente un score de qualité (plus le score est élevé et plus le % d’erreur est petit)
  • Un symbole pour 1 Nt précis
67
Q

Qu’est-ce qui est important de garder en tête avec l’alphabet ASCII ?

A

Les premières Nt analysés ont souvent un taux d’erreur très élevé.

68
Q

Décrivez moi le score de qualité d’un reads en format de données Fastq.

A

C’est une relation inversement proportionnelle. Plus le score est élevé et plus ça signifie que le % d’erreur est petit. Un score de qualité se situe généralement de 0 à 40. Ça permet de définir la qualité des reads.

69
Q

Donnez 3 applications large du séquençage de l’ADN.

A
  1. Assemblage d’un génome (connu ou inconnu)
  2. Détection de variations génétiques (SNPs)
  3. Quantifier les séquences d’un échantillon (amplification génomique, transcrits, ChiP-seq)
70
Q

En quoi consiste l’assemblage d’un génome inconnus ?

A
  • Il faut aligner les reads obtenus au séquençage en essayant de recréer des contigues.
  • Fastidieux
  • Plus de calcul
71
Q

En quoi consiste l’assemblage d’un génome connus ?

A
  • Il s’agit de cartographier, donc d’aligner les reads sur un génome de référence
  • Plus facile
  • Plus rapide
72
Q

Grossièrement, qu’est-ce que le ChIP-seq ?

A

C’est de la quantification des protéines qui peuvent se lier à l’ADN

73
Q

Cartographie vs assemblage, définissez.

A

Assemblage : Alligner les reads obtenus au séquençage en essayant de recréer des contigues.

Cartographie: Aligner des reads sur un génome de référence.

74
Q

Si on parle de région répétées, est-ce un problème pour :

  1. Génération 2
  2. Génération 3
A
  1. Oui, car les reads courts de régions répétées ne peuvent pas être cartographiés ou assemblés
  2. Non, les reads long résolvent le problème des régions répétées.
75
Q

Qu’est-ce que le NGS Paired End de Illumina ?

A
  • Consiste en le séquençage des 2 extrémités
  • Reads ~150 bases (extrémités)
  • Permet de localiser les reads
  • Aide à régler des problèmes avec les séquences répétées
76
Q

Qu’est-ce que la technologie Long Read ?

A
  • 10 000 - 20 000 Nt de long

- Permet de cartographier la localisation et aussi de compter les régions répétées (mais offre moins de reads)

77
Q

Vrai ou faux

Combiner les méthodes de 2e et 3e génération permet de combiner des reads courts (qui sont précis , mais nuls pour les séquences répétées) et de combiner des longs reads pour cartographier des séquences répétées.

A

Vrai

78
Q

Vrai ou faux

Le reséquençage permet la détection de variations génétiques. En effet, ça permet de détecter les différences qui existent dans une même espèce (polymorphismes).

A

Vrai. Il faut s’assurer de faire la différence entre une erreur de séquençage et un polymorphisme.

79
Q

Comment est-ce qu’on s’assure de faire la différence entre une erreur de séquençage et un polymorphisme ?

A
  • Erreur de séquençage : unique dans une séquence

- Polymorphisme : ~50% des séquences (car hétérozygote)

80
Q

Qu’est-ce que la couverture d’un Nt ?

A

C’est le nombre de fois que le Nt a été lu pour faire une contige en particulier.

81
Q

Qu’est-ce que le taux de couverture d’un Nt et quelle est la formule?

A

C’est le nombre moyen de couverture pour tous les Nt d’un génome (représente une moyenne) .
- Plus la couverture est grande et plus l’erreur sur ce Nt en particulier est petite.
- (L x N) /G
L = longueur moyenne des reads
N = Nombre de reads
G = Taille du génome en Nt

82
Q

Qu’est-ce que signifie un taux de couverture élevée ?

A

Moins de trous laissés sans couverture. Donc moins d’erreur de séquençage.

83
Q

Quel est le taux de couverture recommandé pour :

  1. La détection des mutants
  2. Pour une expérience de ChiP-sep ( cartographie des protéines liés à l’ADN)
A
  1. 10 à 30 fois

2. 100 fois