Chapter 2 - Next Generation Sequencing Flashcards

Reader Ch.2

1
Q

Sequencing applicaties

A

-Full genome
-Variant detectie: SNPs vergeleken met referentie (of indels)
-Structurele varianten
-Splice variant detectie
-RNA-seq
-ChIP-seq
-Exome sequencing
-DNA methylatie detectie
-Metagenomics

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Indels

A

inserties en deleties

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat zijn structurele varianten bij DNA/RNA?

A

deleties, duplicaties, copy-number varianten, inserties, translocaties
> sequence affect: 1 kb - 3 Mb

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Van groot naar klein in sequence affected: structurele variatie, SNPs, chromosoom abnormaliteit

A

Chromosome abnormality > structurele variatie > SNPs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hoe ontstaan splice varianten?

A

Alternative splicing

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

RNA-seq

A

sequencing en tellen van mRNA

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Toepassing ChIP-seq

A

analyse van eiwit interacties met het DNA
> ChIP (chromatin immunoprecipation met massively parallel DNA sequencing > mapping global binding sites

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Toepassing Exome sequencing

A

Detectie van genvarianten in het coderende deel van het genoom

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Toepassing DNA methylatie detectie

A

Epigenetisce markers identificeren zoals CpG-methylaties voor repressie van de transcriptie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Metagenomics toepassing

A

Meerdere genomen parallel analyseren van environmental samples
> unbiased view of all the genes in the sample

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

DNA capture techniek mechanisme -> toepassing bij exome sequencing

A

Gebruik van complementare probes aan regions of interest, in dit geval exonen
> de referentie sequenties voor het opstellen van de probes worden uit CCDS gehaald

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

DNA capture technieken: microarray & solution capture

A

-Microarray capture: probes zitten vast aan een vast oppervlak > hybridisatie van exon fragmenten (uit bv fragmentatie/shotgun) met de probes > non gehybridiseerde fragmenten worden weggewassen > sequencing

-Solution capture: probes zitten in vloeistof en hybrisatie vindt plaats in vloeistof. Steptavidin beads worden gebruikt om de complexen neer te laten slaan > ongebonden fragmenten worden weg gewassen > overblijfselen worden gesequenced.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Principe van Next Generation Sequencing

A

Sequencing terwijl de synthese van DNA door DNA polymerase nog bezig is vanaf een single strand template

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Sequencing-by-synthesis/ Illumina sequencing

A
  1. DNA fragmentatie
  2. enzymatische ligatie met adapter sequenties
  3. binding van adapters aan de flow cell waar complementaire adapters aan vastzitten
  4. amplificatie van elk gebonden DNA fragment
  5. er worden spots gemaakt uit clusters van identieke single stranded DNA vanaf de fragmenten
    > nieuw toegevoegde nucleotiden bevatten een fluorophore die tijdens polymerisatie licht uitscheidt
  6. detector vangt het licht, karakteristiek voor de verschillende nucleotiden, op en detecteert de sequentie.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Welke eigenschap moeten de fluorophores van de nucleotiden bevatten om Illumina sequencing te laten werken?

A

Ze moeten als terminator werken die tijdelijk elongatie blokkeert tot de volgende wasstap zodat polymerisatie een-voor-een gebeurt, anders mengsel van lichtsignalen in een cluster/stipje

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wanneer wordt fluorescentie gemeten? (voorafgaand aan welke stap?)

A

voorafgaand aan de verwijdering van de terminator van alle DNA moleculen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Base-calling

A

Het detecteren van basen door de detector: bv door het aflezen van kleurensignalen bij Illumina sequencing op de aparte spots die elk een cluster van één fragment representeren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Single-end sequencing

A

Nadat er fragmentatie en adapters additie heeft plaatsgevonden zullen de fragmenten maar vanaf één kant worden gesequenceerd (forward reads only)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Paired-end sequencing

A

Sequencing vanaf beide uiteinden
> forward en reverse reads die als read pairs worden behandeld
> dubbel aantal reads in library prep
> de reads kunnen overlappen en in dat geval worden gecombineerd tot een langere single-end read na merging
> fragment lengte 200-500 nt
> accurater voor alignment en detectie van indels

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Mate-pair

A

Verschilt van de PE-seq in library prep
> 2-5 kb fragment selectie en sequencing van beide uiteinden
> informatie over hoe nucleotides van ver uit elkaar bij elkaar horen
> structurele varianten detectie
> voor oplossen van repetitieve gevieden tijdens genoom assembly.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Wat zijn barcodes?

A

Unieke sequenties van 5-10 basen (meestal 8) die deel uitmaken van de sequencing adapters (onderscheiden van de samples)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Voordeel van barcodes

A

Je kunt vele samples tegelijk sequencen: maximalisatie van capaciteitsgebruik van de sequencer.
> 8 base barcode > 96 barcodes > 96 samples max
> 12 base barcode > 384

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Index

A

Synoniem voor een barcode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

PCR na de multiplexing (barcode additie)

A

Emulsion PCR en daaropvolgend enrichment en deposition.
> na barcode additie een library prep van de gepoolde samples (alles in een soep gooien)
> sequencing templates van verschillende samples zijn niet langer gescheiden hierbij

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Vanuit NGS onstaat een vast getal van reads uit een pool van DNA fragmenten. Wat voor informatie kan dit geven?

A

Over biologische condities door vergelijing van read number met biologische condities

26
Q

RNA-seq principe

A

Vergelijken van aantal kopieën van elke mRNA transcript via sequencing van cDNA in verschillende celtypes of samples. (PCR voorafgaand aan de sequencing)

27
Q

PCR bias

A

Overrepresentatie van sommige sequenties > heeft invloed op de uiteindelijke library en de kwantificatie van DNA/RNA abundance

28
Q

Unique Molecular Identifiers (UMIs)

A

Korte random nucleotide sequenties die gebruikt kunnen worden als een absolute telmethode (uniek voor elk molecuul (bv DNA, eiwit))

29
Q

UMI additie

A

Elk molecuul in de populatie is uniek gemaakt door additie van UMI voorafgaand aan de PCR sequencing
> UMIs komen in de library > moleculaire geheugen voor aantal moleculen in de startsample
> elke UMI tellen om PCR bias te voorkomen
> identieke kopieën scheiden van aparte moleculen door PCR amplificatie
» PCR errors bepalen

30
Q

Bij welke techniek zijn UMIs handig om te gebruiken?

A

RNA-seq > verbeterde detectie van laagfrequente moleculen

31
Q

Hoeveel unieke UMIs zijn er?

A

UMIs zijn 22 nt lang > 4^22 mogelijke UMIs

32
Q

Workflow UMI additie

A
  1. extensie van primers met UMIs en p5/p7 adapters om de barcoded libraries te faciliteren voor Illumina
  2. PCR 2 cycli > p5/p7 tagged amplicons inclusief UMI (via adapter aan flow cell)
  3. Final library amplification (2e PCR)
  4. Illumina sequencing tot Illumina reads
33
Q

Miscalled bases

A

Incorrect gemeten nucleotiden door de detector

34
Q

Error in NGS

A
  • During library prep > unintended ligation or other polymerization error
  • During sequencing > more common: chance of incorporating wrong or nu nucleotide
    > degradation of light signals due to out of synch
35
Q

What is the limiting factor for NGS read length?

A

The sequencing error rate
> length below 2 x 300 nt

36
Q

Calibration of sequencers

A

Estimation of likelihood of sequencing error depending on light signal

37
Q

Sequencing error rate

A

0.8% > 8/1000
- error is indistinguishable from a SNP
> overcome problem by increasing number of reads
> 8 reads > 0.8^8 % error rate

38
Q

Name the differences between NGS and Sanger Sequencing

A

NGS – Sanger
library construction
NGS reads from fragment libraries – cloning and amplification
parallelism
Parallel procession of millions of reads – 96 reads at a time for gel electrophoresis
read length
50-300 nt – up to 1000 nt
error rate
85-99% – 99.999%
costs
0.0002$ per kb – 0.50$ per kb

39
Q

Were is long-read sequencing used for?

A

Indentifying Structural Variants, repetitive elements, copy-number alterations

40
Q

Read length with long-read sequencing

A

Longer than 1 kb
> useful for transcriptomic research > entire mRNA transcripts
> eliminate randomness in positions or size of genomic elements

41
Q

Third Generation Sequencing

A

newer ways of sequencing like nanopores

42
Q

Types of long-read sequencing

A

-Single-molecule real time sequencing
-Synthetic approaches

43
Q

Single-molecule real time sequencing

A

-Does not rely on clonal population of amplified DNA
-Asynchronous signal detection by fluorescent signal during polymerization of single DNA molecules.
-No sequencing cycles > every signal from every molecule is captured on its own > no limit to read length than availability of nucleotides
-higher error rate than short reads (weaker signal from a single molecule and chance of sequencer error)

44
Q

How can the error rate be lowered in Single-molecule real time sequencing

A

Sequence the same piece of DNA multiple times: but this reduces throughput

45
Q

Synthetic Third Gen Sequencing: Nanopore sequencing

A

Membrane with many pores, and the DNA strand is puled through.
-electrical potential over the membrane
-measuring the flux of currents through the pores specific for the sequence.
-recognize short DNA sequences
-no limit to length of DNA molecule except for mechanical stability of DNA
-Base-calling is harder and error rates are higher than light-based base-calling

46
Q

What is more expensive: third gen (long-read) sequencing or regular NGS?

A

Third gen

47
Q

Data pre-processing steps

A

-Data conversion
-Quality score and trimming
-Sequence alignment / mapping
-Coverage / read depth

48
Q

How is the Phred Score calculated?

A

Q = -log(p)
Q: Phred score
p: probability of sequencing error

49
Q

What is the error rate and accuracy for Phred scores 10 and 40?

A

10 > 1 in 10 incorrect base calls > 90% accuracy
40 > 1 in 10,000 incorrect base calls > 99.99%

50
Q

What happens to the quality across the read?

A

The quality decreases the further downstream (towards 3’-end) in the read

51
Q

You can remove the ends of the reads to improve their quality. But this does affect the quality of the sequence alignment. How?

A

The coverage will decrease (read depth at certain nucleotides)

52
Q

How is sequence alignment performed?

A

So that the most amount of matches is made in nucleotide/amino acid sequence

53
Q

Types of alignments

A

-Unique
-Non-unique
-Low confidence: unique but low quality score, lots of mismatches
-No alignment

54
Q

Which read alignments are kept?

A

Unique alignments

55
Q

Which regions n the genome resemble the non-unique alignments?

A

Low complexity region, pseudogene, repetitive region

56
Q

Read depth (coverage)

A

the (average) number of reads representing a given nucleotide in the reconstructed/reference sequence

57
Q

What does a high coverage mean?

A

Increased reliability of the results like indentificaion of SNPs

58
Q

Breadth of coverage

A

Percentage of the DNA/RNA covered by all the reads

59
Q

Average coverage formula

A

N*L/G
N: number of reads
L: average read length
G: length of the original genome

60
Q

Why is single cell sequencing only possible in the last X years?

A

because less DNA is needed for analysis

61
Q

Applications single cell sequencing

A

-Single cell processes: cancer: transformation, clonal evolution, metastasis, chemoresistance (transcriptomics analysis)
-Study of micro-organisms which cannot be cultured direct (microbiome)