Unidade 3 - Bases de Dados Flashcards

1
Q

Que ferramentas (softwares) existem para a análise de NGS?

A
  • BAM (binary alignment map)
  • BAI (binary alignment index)
  • rCRS (sequência de referência de mtDNA)
  • Torrent browser variant caller (Ion Torrent)
  • Integrative genomics viewer (IGV)
  • NextGENe (SoftGenetics)
  • Sequencher (GeneCodes)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quais são as áreas emergentes nos testes e análises genéticas?

A
  • Variantes não codificantes
  • Teste de metilação de DNA
  • Melhorar a classificação de variantes
  • Variantes com características complexas
  • Determinação do risco em variantes com características complexas
  • Sequenciamento de leituras longas
  • Sequenciamento de uma célula
  • Progresso no cuidado de saúde personalizado de pacientes
  • Ligação clínica: classificação de variantes e clínica Epichroma
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

O que são TEs?

A

Elementos transponíveis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Que tipos de alelos existem?

A
  • Alelos
  • Epialelos
  • Polialélico
  • Bialélico, trialélico, quadralélico
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

O que são alelos?

A

Alelos descrevem as formas alternativas de um gene. Cada pessoa herda 1 alelo de cada parente para cada gene autossomal.
Podem ser alelos normais/selvagens ou anormais/mutantes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

O que são epialelos?

A

Alelos que diferem nos padrões de expressão, devido às modificações epigenéticas em vez das alterações no DNA em si.

EPIalelos - EPIgenética

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Que efeitos podem ter alterações nos epialelos centroméricos?

A

Alteração da função do centrómero e estabilidade do cromossoma, o que pode conduzir a uma segregação cromossomal aberrante e desordens genéticas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

O que significa “polialélico”?

A

Existência de alelos múltiplos num locus específico.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Dá exemplos de polialelos.

A

Micro e minisatélites

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

O que significam os bialelos, trialelos ou quadralelos?

A

Referem-se ao nº de nucleótidos distintos (2/3/4) que existem numa posição de base específica de um alelo, numa população da espécie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

O que é um locus?

A

Localização cromossomal específica de um gene ou sequência

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

O que é um haplotipo?

A

Variações de DNA adjacentes uma à outra no mesmo locus, que tendem a ser herdadas juntas.
Pode ser referido como polimorfismos ligados

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Dá exemplos de haplotipos.

A

Polimorfismos como SNPs e indels

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Que utilidade têm os polimorfismos de DNA?

A
  • Estimativa da variação genética em populações diversas
  • Identificação de fatores de risco
  • Identificar indivíduos (ex.: forense, parentesco; monitorizar doenças virais ou bacterinas)
  • Associação com características desejáveis em animais e plantas
  • Monitorizar diversidade genética
  • Evolução e história de populações humanos; padrões de migração
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

O que são os “Genome Browsers”?

A

Programas que permitem o utilizador ver e pesquisar genomas inteiros, na forma de gráficos de dados genómicos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qual foi o primeiro genome browser?

A

The Saccharomyces Genome Database

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qual é a diferença entre genome browsers e outras bases de dados?

A

Os genome browsers mostram os dados graficamente, com coordenadas de genomas num eixo e a localização das anotações no outro

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Que genome browsers existem para o genoma humano?

A
  • UCSC
  • Ensembl
  • Genome data viewer (NCBI)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

O genome browser “Ensembl” foca-se em que genomas?

A

Genomas de vertebrados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Que tipo de análises podem ser feitas no Ensembl?

A
  • Genómica comparativa
  • Evolução
  • Variação de sequência e regulação de transcrição
  • Anotação de genes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Que ferramentas tem o Ensembl?

A
  • BLAST
  • BLAT
  • BioMart
  • VEP (Variant Effect Predictor)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Que dados são integrados nos genome browsers?

A
  • Sequências genómicas
  • Genes e marcadores
  • SNPs
  • Elementos funcionais não codificantes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Que ferramentas tem o genome browser UCSC?

A
  • BLAT
  • Table browser
  • Genome graphs
  • Gene sorter
  • VisiGene
  • Proteome browser
  • Procura de genes por termos
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

O que significam as caixas preenchidas e as linhas no UCSC?

A

Caixas preenchidas - exões
Linhas - intrões

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
O que significam as setas para a direita e esquerda no UCSC?
Setas p/ direita - cadeias sense Setas p/ esquerda - cadeias anti-sense
26
Quais são as principais características do browser UCSC?
- Elevada quantidade de DNA - Personalizável - Páginas detalhadas - Alinhamento de sequências - Visualização de SNPs - Estudos de homozigotia - Definições de loci de doenças - Visualizar polimorfismos - Links para bases externas
27
Como é organizada a informação no browser UCSC?
Por tracks. Tracks são conjuntos específicos de dados ou anotações mostradas ao longo de uma região genómica
28
No browser UCSC, que tipos de tracks existem?
- Bandas cromossómicas - Localização de gaps - Genes conhecidos - Genes preditivos - Doenças e fenótipos - Dados melhorados - Microarrays - Conservação evolutiva - SNPs - Posição da base
29
No UCSC a informação (tracks) pode ser compactada de diversas formas. Que opções tem?
- Hide: torna o track invisível - Dense: conjuga todas as características numa linha - Squish: mostra cada característica numa linha separada sem etiquetas - Pack: mostra várias características em cada linha, com etiquetas - Full: mostra cada característica numa linha separada com etiquetas
30
O que é um "Assembly"?
É um conjunto de cromossomas, com sequências deslocalizadas e loci alternativos, usados para representar o genoma humano.
31
Com que frequência são atualizadas as assemblies?
Sempre que saem novos dados.
32
Como se faz uma assembly?
Genoma -> cortar em pedaços -> clonar em vetores -> sequenciar clones -> montar as sequências em contigs -> montar os contigs em scaffolds -> mapear
33
O que faz a ferramenta Blat?
Ferramenta de alinhamento rápido que permite ao utilizador alinhar DNA ou sequências proteicas às assemblies do genoma
34
O que faz a ferramenta Table Browser?
Interface que permite recuperar dados associados aos tracks
35
O que faz a ferramenta Genome graphs?
Facilita a visualização de conjuntos de dados do genoma inteiro, como GWAS, etc
36
O que faz a ferramenta Gene Sorter?
Mostra uma tabela de genes que são semelhantes em algum parâmetro
37
O que faz a ferramenta VisiGene?
Microscópio virtual para ver imagens de hibridização in situ.
38
O que faz a ferramenta Proteome Browser?
Permite ver proteínas e as suas propriedades
39
O que é o "Valor C"?
É o total de DNA num genoma haplóide.
40
O que entende por paradoxo do valor C?
O paradoxo está na discrepância entre o valor C (tamanho do genoma) e a complexidade do organismo.
41
Quantos nucleótidos tem o DNA nuclear humano?
3 biliões
42
Quantos nucleótidos tem o DNA mitocondrial humano?
16.500
42
Quantos nucleótidos tem o DNA nuclear de E. coli?
5 milhões
42
A que organismo pertence o maior genoma? Que tamanho tem?
Paris japonica - 50 vezes maior que o genoma humano
43
Quantos pares de cromossomas tem o genoma humano?
23
44
Quantos pares de cromossomas tem a Drosophila?
5
45
Quantos pares de cromossomas tem a planta feto?
> 250
46
Que gama de tamanhos têm os cromossomas humanos?
Mín - 50 Mb (cromossoma 21) Máx - 263 Mb (cromossoma 1)
47
Que percentagem do genoma humano é não codificante'?
98,5%
48
Que percentagem do genoma humano é transcrita?
80%
49
Quantos SNPs tem cada genoma humano?
3 milhões
50
Que proporção de nucleótidos difere do genoma de um humano para o de um chimpanzé?
1,3%
51
Que proporção de nucleótidos difere entre o genoma de quaisquer dois humanos?
0,1%
52
Que percentagem do genoma humano está conservada em relação ao genoma de mamíferos?
5%
53
Quantos genes humanos codificam para proteínas?
20.000
54
Quantos genes de RNA não codificante tem o genoma humano?
25.000
55
Quantos pseudogenes que podem ser transcritos, mas não traduzidos, tem o genoma humano?
14.000
56
Qual é o tamanho médio dos genes humanos?
10.000 a 15.000 nucleótidos
57
Qual é o maior gene humano?
Gene DMD (gene distrofina) - 2.4 milhões de nucleótidos - Codifica uma proteína com 3685 aminoácidos
58
Que gene codifica a maior proteína humana?
Gene TTN (titina) - Proteína de 34.350 aminoácidos
59
60
61
Que gene codifica a menor proteína humana?
Gene da histona - < 500 nucleótidos
62
Quantas cópias do genoma mitocondrial humano existem no citoplasma?
500 a 1000
63
Quantas cópias do genoma mitocondrial humano existem no núcleo?
2 em média
64
Qual é o nº médio de exões num gene?
8,8
65
DNA e genes são a mesma coisa?
Não
66
O que é o Repitoma?
É a coleção completa de sequências de DNA repetitivo presentes num genoma.
67
Que funções desempenha o Repitoma?
- Regulação da cromatina - Regulação dos genes - Papeis estruturais em funções vitais, como a segregação ou preservação do material genético
68
O Repitoma compõe uma parte pequena ou grande do genoma humano?
Grande. Pouco menos de metade.
69
O que são as Tandem Repeats (TRs)?
- São cópias múltiplas de repetições curtas com propriedades raras, como a possibilidade de serem identificadas como um pico separado numa análise de gradiente de densidades de DNA. - Representam uma das classes de variantes mais abundantes. - São polimórficos e multialélicos por natureza. - São altamente instáveis quando longos. - Têm a taxa mutacional mais elevada no genoma. - Espalhados principalmente nas regiões não-codificantes do genoma.
70
Onde são principalmente encontrados os TRs?
Nas regiões não-codificantes do genoma
71
O que são as repetições em tripletos?
Repetições de tripletos (CAG|CAG|CAG|CAG|...), limitadas em tamanho Encontradas em regiões codificantes dos genes, e podem tornar-se focos para mutações frameshift prejudiciais
72
O que significa STR?
Short Tandem Repeat
73
Que tipos de STRs existem?
- STRs que afetam as regiões codificantes - Regiões não-codificantes dos genes
74
Que consequências têm os STRs que afetam as regiões codificantes dos genes?
Levam a fragmentos anormalmente longos de poliglutamina ou polialanina em proteínas - Poliglutamina (polyQ, principalmente codificada por codões CAG) - Polialanina (polyA, codificado por codões GCN)
75
Quais são os principais mecanismos associados a expansões de repetições?
- Metilação de DNA - silenciamento epigenético - Missplicing - Tradução canónica - Inclusões nucleares
76
O que significa UTR?
Untranslated region Região não-traduzida
77
Onde estão localizadas as expansões hipermetiladas?
Em promotores ou 5'-UTRs encontram expansões grandes e ricas em GC que estão associadas à hipermetilação do DNA
78
O que acontece quando o DNA é hipermetilado?
Alelos metilados ficam presos numa configuração de cromatina que previne a expressão genética e leva à perda de função do alelo expandido
79
Dá exemplos de mecanismos de expansões hipermetiladas.
Expansões em FMR1 - Síndrome de X frágil Expansões em XYLT1 - Síndrome Scott-Baratela