Conceitos Flashcards

1
Q

Medidas de diagnóstico para testes dicotômicos (6)

A
  • Sensibilidade
  • Especificidade
  • LR+
  • LR -
  • VP+
  • VP-

(ref: “the diagnostic odds ratio”)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Definição de Acurácia

A

A acurácia reflete a habilidade do teste em detectar a presença da condição alvo. “quantas vezes ele acerta”.

Pode ser calculado por:
Verdaderos positivos + falsos positivos / número total de testes.

Ressalva: o risco de um falso positivo e de um falso negativo podem ser diferentes, bem como suas implicações.

ref: Cochrane handbook understanding test accuracy measures

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Defina sensibilidade

A

proporção de pessoas acometidas pela condição alvo e que testam positivo para o teste em questão. Tb chamado de taxa de verdadeiro positivo

Ref: understanding test accuracy measures Cochrane handbook

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Defina especificidade

A

Proporção de testes negativos entre quem é saudável. Tb chamado de taxa de verdadeiro negativo

Ref: understanding test accuracy measures Cochrane handbook.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Testes com alta sensibilidade são úteis para:

A

Rastreio.

Ref: understanding test accuracy measures Cochrane handbook

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Definição de Valor Preditivo Positivo e Negativo

A

VPP: proporção de verdadeiros positivos entre todos os positivos. Probabilidade de que uma pessoa aleatória que teste positivo de fato tenha a doença.
VPN: proporção de verdadeiros negativos entre todos os negativos. Probabilidade de que uma pessoa aleatória que teste negativo de fato seja saudável.

Ref: understanding test accuracy measures Cochrane handbook

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Verdadeiro ou falso?

Sensiblidade e especificidade são intrínsecos ao teste diagnóstico e não variam entre populações diferentes.

A

Falso! muitos testes têm sua sensibilidade e especificidade influenciada pela prevalência, pelo espectro da doença (que pode ser consequência da maior prevalência).

Ref: understanding test accuracy measures Cochrane handbook // variations of a tests sensitivity and specificity with disease prevalence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Defina LR + e LR -

A

LR+: quantas vezes o teste positivo é mais comum em pessoas doentes em comparação às pessoas saudáveis?

Sensibilidade / (1-especificidade)

ou

verdadeiros positivos / falsos positivos

LR-: quantas vezes o teste negativo é mais comum em pessoas saudáveis em comparação às doentes?

1 - sensibilidade / especificidade

ou

falsos negativos / verdadeiros negativos

Ref: understanding test accuracy measures Cochrane handbook

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Index de Youden: interpretação

A

sensibilidade + especificidade - 1.

Quanto mais perto de 1, mais acurado. Quanto mais perto de 0, menos.

O zero significa incapacidade de alterar a pré-teste. A proporção de verdadeiros positivos é igual à de falsos positivos, e a de verdadeiros negativos à de falsos negativos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Diagnostic Odds Ratio: definição e cálculo

A

Descreve quantas vezes mais são as chances de obter um teste positivo em alguém com a doença alvo selecionado aleatoriamente em comparação com alguém saudável.

falsos positivos/ verdadeiros negativos

ou

(1 - especificidade) / especificidade

ou

sensibilidade x especificidade / (1 - sensibilidade) (1 - especificidade)

Ref: understanding test accuracy measures Cochrane handbook

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

O que o Youden Index, Diagnostic Odds Ratio e acurácia geral têm em comum?

A

Não são informativos quanto à natureza dos erros (falso positivo x falso negativo), e o peso disso é relevante para o paciente.

Ref: understanding test accuracy measures Cochrane handbook

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Definição de Curva ROC

A

Gráfico obtido a partir da variação do limiar de positividade por todos os valores possíveis, plotado pela sensibilidade (eixo y, ordenadas) versus 1-especificidade (eixo x, abcissas).

Quanto mais a curva se aproxima do canto superior esquerdo (onde especificidade e sensibilidade são 1), mais discriminatório é o teste. Pode ser simétrica ou assimétrica, tipicamente quando há discrepância de variabilidade na distribuição dos valores entre os grupos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Outro nome da AUC:

A

Estatística C

Ref: understanding test accuracy measures Cochrane handbook

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

AUC:

A

Area Under the (ROC) Curve.

se for 0,5 n serve pra nada.

Ref: understanding test accuracy measures Cochrane handbook

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

O que a AUC representa?

A

Representa a probabilidade que alguém com a doença tenha um resultado maior do que alguém saudável.

Também pode ser interpretada como a sensibilidade media do teste considerando todos os valores de especificidade ou o inverso.

Ref: understanding test accuracy measures Cochrane handbook

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Como o sistema GRADE classifica as evidências quanto à qualidade?

A

Alta, moderada, baixa e muito baixa. ECR sai de alta e vai sendo rebaixado conforme limitações. Obs sai de baixa e vai subindo conforme qualidades. Séries e relatos de casos são baixa a muito baixa.

Via de regra, limitações não claras mas que provavelmente não influenciam o desfecho não necessitam ser rebaixadas. Diante disso um vermelho já rebaixa a qualidade para moderada. O amarelo pode rebaixar ou não, dependendo do desfecho: cegamento pode n ser relevante em desfecho duro por ex.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qual é a definição de qualidade da literatura pelo sistema GRADE?

A

Não é a validade interna, mas o grau de confiança de que o agregado de estudos fornece informação correta (ou adequada para suportar uma recomendação, no caso de guidelines)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

De acordo com o GRADE, o que são limitações do estudo?

A

São as que comprometem a validade interna dele. O RoB2 pode ser melhor usado para avaliar estudos individuais. Afetada por truncamento, seletivo reporting Bias, perda de follow-up, viés de alocação, falta de cegamento, contabilidade incompleta de pacientes e desfechos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Para que serve a randomização?

A

A randomização serve para estabelecer balanço prognóstico, equilibrando fatores conhecidos e desconhecidos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Principais limitações em estudos observacionais (4)

A

O risco principal é a falta de balanço prognóstico. Contudo, tende a ser atenuado com amostras do mesmo período de tempo, lugar e popuacao, alem do controle para fatores prognósticos conhecidos.

Os principais vieses são
1) falha em critérios de elegibilidade adequados
2) Falha na medida de exposição e desfecho
3) Falha no controle de confundidores
4) follow up inadequado

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

O Effect Size e medidas relativas variam com o risco basal do paciente.

Verdadeiro ou falso?

A

Medidas relativas como o ES via de regram não variam com risco basal do paciente. Essa característica é mais das medidas absolutas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Qual a definição de inconsistência?

A

É heterogeneidade não explicada!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Formas de avaliar a consistência do corpo de evidência (4)

A

1- Variação grande da estimativa pontual entre estudos
2- Overlap minimo ou ausente dos IC, sugerindo variação maior do que a esperada pela chance
3- Critério estatístico (p<0.05 -> rejeita hipótese nula de que a heterogeneidade é pela chance e os resultados tem mesma magnitude de efeito)
4- I2 -> descreve variação da estimativa nao devida ao acaso! Via de regra, acima de 50-60% fica desconfortável

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Influencia do tamanho do trabalho na heterogeneidade

A

Trabalhos pequenos podem variar por chance, dando I2 baixo! Trabalhos grandes podem variar pouco e gerar I2 elevado

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Pitfalls da interpretação do I2

A

A I2 é em relação ao tamanho de efeito dentro da estimativa, e nem sempre é relevante. Se há overlap significativo do IC dos trabalhos mesmo que as estimativas-ponto sejam em direções opostas, tudo bem. Da mesma forma, se não há overlap mas todos os trabalhos estão em faixa clinicamente relevante, também nao importa.

Se a maioria dos trabalhos é consistente em mostrar benefícios, mesmo uma heterogeneidade mais altinha pode ser tolerada.

Na verdade, o principal problema é quando ela não é explicada!

26
Q

Análise de subgrupos: Qual o principal risco?

A

A maioria é putativa e espúria, especialmente quando feita com base em comparações ENTRE estudos diferentes (isso é atenuado em meta analises com individual patient data). Na real, sua credibilidade é um continuum.

27
Q

Do que depende a credibilidade de uma análise de subgrupo? (7 critérios)

A

1) É especificada a priori? Sua direção foi confirmada subsequentemente?
2) Comparação é feita dentro do mesmo estudo ou entre estudos diferentes?
3) Análise estatística sugere chance como explicação improvável? (P-valor, cuidado c/ ajustes para múltiplas comparações)
4) A variável do subgrupo foi especificada no baseline?
5) Foi só uma de várias testadas?
6) A diferença de subgrupo é consistente entre os estudos e entre desfechos importantes?
7) Há evidência externa biológica ou sociológica que suporte a hipótese da diferença de subgrupo?

28
Q

Directness. Definição

A

Quao direta é a comparação da intervenção, pacientes e desfechos com o que estamos realmente preocupados?

29
Q

Influência da população no grau de directness da evidência

A

Em geral, só consideramos relevante se tiver algum motivo especial que faca desconfiar que o efeito varie em termos de risco relativo!

30
Q

Efeito da intervenção no directness

A

Só rebaixa por isso se suspeitar que a diferença é suficientemente relevante. Não é necessário e nem desejável que a pop e a intervenção sejam idênticas às do estudo.

Exemplo: estatinas reduzem mortalidade. Uma estatina nova precisa demonstrar reducao de mortalidade? Eu opino que sim, mas há quem discorde.

31
Q

Importância dos desfechos na directness da evidência

A

Pode ser por temporalidade (se existe benefício após 3m, será que se mantém aos 9m?

E pode ser por surrogate também. Via de regra, surrogate diminui em 1 ou até 2 níveis de evidência, dependendo da biologia e da historia natural da doença, a não ser que ele já seja muito bem estabelecido como válido!

32
Q

Comparações indiretas entre intervenções: qual o problema?

A

É quando se compara 2 ou + intervenções que não foram comparadas diretamente nos estudos. O BO é que as diferenças em RR encontradas podem ser decorrentes do grupo de pacientes, critérios de inclusão usados, métodos de aferição e etc. Se for mto semelhante, só rebaixa um nível!

33
Q

Definição de imprecisão

A

Quão precisa é a estimativa que temos do tamanho de efeito do estudo. Usualmente é capturada pelo IC, que é a porcentagem que um mesmo estudo repetido inúmeras vezes abrangeria o valor real nos ICs calculados.

34
Q

Avaliação de imprecisão:

A

Estipula limiares de relevância clínica de benefício e malefício, de acordo com o grau de toxicidade da droga. Se cruza, rebaixa por imprecisão.

A fragilidade é que o N pequeno pode gerar IC estreito em alguns casos, provavelmente por causa do desequilíbrio prognostico: O IC parte do pressuposto de que os grupos estão balanceados, e isso só em garantido em randomização com N suficiente! Truncamento precoce tb.

Outra forma de avaliar é pelo optimal information size!
Se o numero total de pacientes na revisão sistemática for menor do que o calculado de forma convencional p/ um trial, rebaixa por imprecisão. Esse numero pode ser calculado ou consultado com figuras, de acordo com RR esperado, tamanho amostral e/ou numero de eventos.

35
Q

Optimal Information Size

A

Se meta-análise tem N menor do que o calculado para um trial normal, rebaixamos por imprecisão. Dá para ter pouco N desde que a incidência de eventos seja suficiente.

A exceção é quando o N é grande e a taxa de eventos pequena, pq supõe-se que 2k em cada grupo pelo menos garante o balanço prognóstico. O RR pode ficar muito amplo e ser consistente com beneficio importante ou risco importante, mas se olhar o RAR ele provavelmente
é estreito

Se for adequado, considerada precisa adequada se o IC não cruza a nulidade!
Gráficos:

36
Q

Fluxograma imprecisao

A
37
Q

Inconsistência em variáveis contínuas?

A

Abaixo de 400 de TA já garante rate-down por imprecisão, mas n tem mto uma regra fixa pra avaliar o TA que garante um valor prognóstico. A abordagem recomendada é a seguinte:

Se o limite superior e inferior forem os verdadeiros, a recomendação muda?
Se sim, rebaixa por imprecisão
Se não, vê sê cumpre o optimal information size. Se cumprir, não rebaixa. Se nao cumprir, rebaixa.

38
Q

Viés de publicação: definição e implicacoes

A

Viés de publicação é quando a estratégia de busca deixa de identificar artigos porque são em outra língua, em revistas não indexadas, em literatura cinza ou não publicados.

Isso acontece mais com trabalhos pequenos, porque passam mais facilmente desapercebidos. Como resultado, tende a superestimar o tamanho de efeito em cerca de 20% quando comparado com trials maiores subsequentes.

Trials grandes podem publicar em jornais ruins tb ou até atrasar demais (lag time Bias) pra publicar.

39
Q

Quando rebaixar por viés de publicação?

A

Quando estudos pequenos, ainda mais quando financiados pela indústria ou realizados por autores com rabo preso. Se a busca não inclui muitas bases de dados ou papers nao publicados, também pode ser um indicativo.

Egger’s test, funnel plot assimétirco, trim and fill e etc são melhor usados em combinacao, mas o ideal é a busca por literatura nao publicada. Se esses artigos são discrepantes em relação aos publicados, risco alto de Publication Bias.

Se for suspeito (indústria e funnel), rebaixa em 1 nível. Se for certeza pode rebaixar até 2.

40
Q

Quais são os 3 caminhos que podem elevar o nível de evidência observacional no sistema GRADE?

A

Só olha pra isso se o trabalho for bom, e depois de ver os viéses!
1) Grande magnitude de efeito
2) gradiente dose-resposta
3) controle de confundidores: especialmente se a direção dos confundidores presentes sugerir subestimação do tamanho da intervenção.

41
Q

Como a grande magnitude de efeito aumenta a evidencia de trabalho observacional?

A

trabalho bem conduzido e com estimativa de efeito grande deia razoável a conclusão de que existe um efeito real (de algum tamanho) e que casualmente se relaciona à intervenção. Possivelmente, RR > 2 ou <0.5 são improváveis de serem explicados por desequilíbrio prognóstico. >5 ou <0.2 ainda mais improvável. Aumenta em um nível ou 2, respectivamente. Desde que o trabalho seja bom.

Rapidez de efeito tb diminui tempo de ação de fatores de confusão, e evidencia indireta de situações semelhantes aumentaa a confiança. Taxa do grupo controle próxima à nulidade tb.

42
Q

O que significa um grau de recomendação forte no sistema grade?

A

Significa elevada confiança no balanço entre benefícios e consequências, seja ele a favor ou contra a intervenção. Nesse sentido, todos ou quase todos os pacientes informados desse balanço tendem a optar a favor da recomendação.

Pode ser representado por 1 ou duas setinhas pra cima.

Geralmente necessidade pelo menos grau moderado de qualidade da evidencia. Com baixo, só é aceitável quando um baixo arrependimento resultaria se surgisse evidencia mostrando que a recomendação for errada.

Ou seja:
- situação de vida ou morte
- pouca confiança no beneficio mas muita nos custos e riscos
- confiança semelhante de beneficio mas falta nos riscos
- evidencia moderada-alta de beneficio, baixa de dano mas ele é possivelmente catastrofico

43
Q

O que significa nivel de reocmendacao fraco no sistema GRADE?

A

Menos confiança no balanço, não na evidencia. Pode ser chamada de condicional.
Como o balanço é mais próximo, a variabilidade dos valores inter-pessoais faz com que exista um número significativo de pessoas que optem contra a reocmendacao, necessitando mais tempo devotado à decisão compartilhada.

44
Q

O que determina a direção e forca de recomendações? (6)

A

Magnitude do tamanho de efeito nos desfechos de interesse em benefícios e prejuízos
Confiança nessa estimativa
Estimativa de valores e preferências típicos dos pacientes
Confiança nessa estimativa
Variabilidade dessa estimativa
Uso de recursos

45
Q

O que é o Erro Aleatório?

A

É o componente de variação cuja etiologia desconhecemos. Pode ser de fato aleatório ou só o que não conhecemos ainda.

Note q uma população eh sempre um recorte possível de uma população ainda maior, de form que existe erro de amostragem. Além disso, há variacao inexplicável em medidas de ocorrência.

Ref: Rothman chapter 15

46
Q

Quando começou a preocupação com teste de significância?

A

No inicio do século 20, com problemas primariamente na agricultura e indústria.
Ref: Rothman chapter 15

47
Q

Como é feito o teste de significância?

A

A H1 geralmente é de que a associação existe nas superpopulações que contém as populações das amostras. A H0 é de que não existe.
Ambas são sobre a superpopulação, e não sobre aos grupos observados.

Ref: Rothman chapter 15

48
Q

Teste de significância nulo:

A

Significa apena que não dá pra rejeitar a hipótese nula de que as duas superpopulações são iguais, mas não significa que elas são.

Ref: Rothman chapter 15

49
Q

Teste de significância positivo:

A

não significa necessariamente também que a associação existiu entre as 2 superpopulações.
pode significar que o modelo usado pra computar foi errado ou por erro aleatório mesmo.

Ref: Rothman chapter 15

50
Q

Tipos de P valor

A

Ambos assumem que a hipotese testada é correta e que nao existe viés na analise ou na coleta dos dados.
One tailed: Os 5% ficam tudo de um lado só, então pode ser mais fácil de achar significância.
- upper: probabilidade que o valor correspondente do teste estatístico seria igual ou maior do que o observado
- lower: probabilidade que o valor observado do teste estatístico seja menor ou igual.

Two-tailed: distribui pros dois lados

Ref: Rothman chapter 15

51
Q

P valor e nível de significância são a mesma coisa?

A

Não. O nível de significância é o alfa, nosso cutoff. O P valor é o resultado de um teste.

Ref: Rothman chapter 15

52
Q

Defina P valor

A
  • Medida continua de compatibilidade entre uma hipótese e os dados. Todos dependem de um modelo estatístico, até mesmo os não-paramétricos.

Não é probabilidade das hipóteses testadas, e nem a probabilidade de achar um efeito tão grande quanto ou maior que o observado se a hipótese nula for correta, apesar de mtos livros colocarem essa definição.

Esse erro decorre do fato de que o P valor depende do tamanho da estatística usada (vários tipos, pode depender geralmente da estimativa de efeito dividida pela estimativa do desvio padrão), não diretamente do tamanho da estimativa associada.

Ref: Rothman chapter 15

53
Q

Erro tipo 1 e erro tipo 2

A

Primeiro, um teste válido é aquele em que se a hipótese nula for verdadeira, o P nao fica < do que o alfa em mais do que alfa% das vezes.

tipo 1/alfa: falso positivo. Rejeição incorreta da hipótese nula.
O aceitável é o alfa, de forma que um cutoff de alfa de 5% permite falsos positivo em 5% das vezes.

tipo 2/beta: falso negativo. Aceitação incorreta da hipótese nula. Dada pelo poder (beta = 1 - poder).
Magnitude de efeito, viéses e variação aleatória combinadas das resultados insuficientemente inconsistentes com a hipótese nula pra rejeitar. Pode ser por efeito pequeno, poucas observações ou viés mesmo.

Existe um tradeoff entre os tipos de erro. Note também que mtas vezes os limiares estabelecidos de tolerância de erros tipo 1 e tipo 2 vao contra o publico. Se algo faz mal, existe 20% de chance de não encontrarmos esse efeito e 5% de encontrarmos um efeito q n existe kk.

Ref: Rothman chapter 15

54
Q

Defina intervalo de confiança

A

Dá o intervalo de valores de parâmetros que o P-valor fica dentro do alfa. É delimitado pelos limites de confiança, e calculado pelo processo de estimação do intervalo.

O nível de confiança (e.g. IC95%) é dado por 1-alfa.

Se o modelo estatístico subjacente for correto e não existir viés, um intervalo de confiança derivado de um teste válido vai conter o parâmetro verdadeiro em repetições infinitas do estudo em uma frequência não menor que seu nível de confiança.

Ou seja, um IC 95% mostra que o mesmo estudo repetido infinitas vezes irá conter o valor real em pelo menos 95% das vezes.

Pode ser visto também como uma estimativa bruta da incerteza em um estudo epidemiológico derivada do erro aleatório.

Ref: Rothman chapter 15

55
Q

Do que depende a largura do IC?

A

Da quantidade de variação estocástica inerente ao processo de coleta de dados, do alfa Level e dos dados.

Ref: Rothman chapter 15

56
Q

Vantagens do IC

A
  • dá significância estatística de forma dicotomica para o alfa usado no nível de confiança.

-dá ideia de direção, magnitude e variabilidade randômica da estimativa ponto.

Ref: Rothman chapter 15

57
Q

Desvantagem principal IC e p-valor

A

Não fazem nada para avaliar vieses q podem estar presentes.

Ref: Rothman chapter 15

58
Q

Componentes principais do IC

A

Estimativa-ponto, limites de confiança e nível de confiança (1 - alfa)

Ref: Rothman chapter 15

59
Q

Relação IC e alfa

A

IC é a faixa de valores compatíveis em q P fica dentro do alfa. O nível de confiança é dado por 1-alfa.
Quanto maior o alfa, menor o nível de confiança do IC e mais preciso ele aparenta ser.

Nesse sentido, o IC 90 está contido dentro do IC 95.

Você consegue ser mais preciso na estimativa quando é permitido errar mais em termos de falso-positivo.

Ref: Rothman chapter 15

60
Q

Como avaliar semelhança de intervalos de confiança?

A

O melhor jeito é pelo overlap das funções deles, mesmo mentalmente. Os limites do intervalo de confiança não servem tanto pra interpretação dele propriamente dita, mas sim para ver o spread que indica a precisão.