TP - BLAST Flashcards

1
Q

O que significa a sigla BLAST?

A

Basic Local Assignment Search Tool

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

O que é o Query?

A

Sequência de DNA ou proteína submetida a uma base de dados para ser comparada

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Como se calcula a % de identidade?

A

nº de resíduos idênticos / nº total de matches

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

O que nos diz a % de identidade?

A

Define a percentagem de aminoácidos (ou nucleótidos) com uma correspondência direta no alinhamento

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

O que significa quando existe uma elevada similaridade?

A

Implica que pode haver um ancestral comum ou uma função em comum

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Como é expressa a similaridade?

A

Em % de identidade

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

O que significa o termo “Homologia”?

A

Refere-se a características (genes ou funções) que descenderam de um ancestral comum.
Implica uma relação evolucionária.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

O que significa o termo “Ortólogo”?

A

Genes ortólogos evoluiram de um ancestral comum, podendo diferir na sua função e sequência genética, mas possuem o mesmo papel biológico básico

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

O que significa o termo “Parálogo”?

A

Genes parálogos surgem de eventos de duplicação durante a evolução.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

O que é uma substituição conservativa?

A

É quando um aminoácido sofre uma mutação para um resíduo semelhante, mas as suas propriedades não se alteram.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Como se calcula o comprimento de query?

A

nº de nucleótidos / a.a na sequência pesquisada

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

O que é a cobertura de query?

A

É o quanto a sequência está coberta por alinhamentos significativos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

O que é o “E value”?

A

Expected value.
Probabilidade de um match ocorrer por acaso.
Idealmente deve ser próximo de 0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Para que servem as gap penalties?

A

Para ajustar o score do alinhamento, de acordo com o nº e comprimento dos gaps.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qual é o sistema de pontuação em scores de alinhamento?

A

Correspondência de base (+1)
Não-correspondência de base (-1)
Gap penalty (-2)
Gap penalties seguidos (-11; -1 (..))

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Que consequências podem haver quando há demasiados gaps?

A

A sequência pode deixar de fazer sentido.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

O que significa o valor de score de alinhamento?

A

Representa a semelhança entre as sequências.
Quanto maior o score, maior é a significância do “hit”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

O que são raw scores?

A

São scores calculados a partir da matriz.

19
Q

O que são bit scores?

A

São scores normalizados e comparáveis entre pesquisas para considerar diferentes matrizes e bases de dados.

20
Q

O que significa a sigla HSP?

A

High Scoring Pair

21
Q

O que são os HSPs?

A

São duas sequências de igual tamanho e que, quando alinhadas, possuem o score máximo

22
Q

Qual é o sistema de pontuação em scores de matrizes?

A

Base correspondente (+2)
Base não-correspondente (-3)
a.a raro correspondente - pontos máximos

23
Q

Existem 4 matrizes de score diferentes, quais? Qual delas é mais eficaz?

A

BLOSUM 90
BLOSUM 80
BLOSUM 62 - mais eficaz em encontrar todas as potenciais similaridades (30-40% semelhanças)
BLOSUM 30

24
Q

Qual é a diferença entre o alinhamento de sequências local e o global?

A

Local: compara partes de sequências
Global: compara sequências inteiras

25
RefSeq é redundante ou não-redundante?
não-redundante
26
Para que serve o BLASTX?
Para identificar regiões codificantes de proteínas em sequências de nucleótidos
27
Para que serve o TBLASTN?
Para pesquisar sequências de nucleótidos que codificam proteínas semelhantes à sequência query.
28
O que são os "accession numbers"?
Identificadores associados à sequência submetida na base de dados
29
Quais são os 3 passos/regras para refinar sequencialmente os potenciais HSPs?
1 - Seeding 2 - Extensão 3 - Avaliação
30
Explica o 1º passo (Seeding) do refinamento de potenciais HSPs.
Determinação das localizações de todas as words comuns (word hits). Quanto maior o tamanho da word, menos hits vai gerar.
31
Explica o 2º passo (Extensão) do refinamento de potenciais HSPs.
Após encontrar um hit, extender o hit em ambas as direções. Para antes do score cair abaixo do cutoff.
32
Explica o 3º passo (Avaliação) do refinamento de potenciais HSPs.
Avaliação com E-values.
33
O que são "words" no BLAST?
São o nº de letras.
34
O que são words vizinhas?
São sequências iguais à query onde apenas muda um nucleótido.
35
O que é um "hit"?
É uma correspondência entre uma word e uma entry (entrada) na base de dados.
36
O que é o "W"?
É o tamanho da word.
37
O que é o "T"?
É o threshold (limite) do score da word vizinha.
38
Para que serve o "T"?
É usado para reduzir o nº possível de words correspondentes. Words com scores >T permanecem na lista de possíveis words correspondentes. Quando score
39
Que efeitos positivos e negativos tem um elevado valor de "T"?
- Remove mais hits de words, reduzindo o espaço de pesquisa - BLAST tem uma execução mais rápida - Perda de sensibilidade
40
O que é uma sequência canónica?
É uma sequência de DNA/RNA/a.a que reflete a escolha mais comum de base para cada posição
41
O que são os cutoffs ou guidelines?
São os limites de E-value, % de identidade que permite analisar
42
Que utilidade tem a ferramenta de filtrar?
Permite filtrar os resultados para não alinhar com sequências com muitas bases iguais (porque são pouco específicas)
43
O que são as posições homoplásicas?
São reversões de mutação. (espécies diferentes passam a ter características iguais)
44
O que é a hipermutabilidade?
São os hotspots mutacionais, onde existe uma taxa de mutação muito elevada.