Etudes diagnostiques Flashcards
(29 cards)
Etudes diagnostiques : généralités ?
= évaluer l’apport d’un signe clinique, d’un élément biologique ou d’un examen pour le diagnostic d’une maladie : c’est la performance diagnostique du test à l’étude
!!! Ne pas confondre avec l’évaluation d’impact d’une démarche diagnostique/dépistage !!!
Etudes diagnostiques : étude diagnostique/dépistage de performance ?
=> évaluer les capacités du nouveau test à bien diagnostiquer/dépister la maladie : le CDJ principal sera l’ensemble des performances diagnostiques du test (Se, Sp, VVP, VPN, RVP, RVN +/- courbe ROC)
- type d’étude privilégié : étude transversale => pour avoir au même moment les données de la réalisation du test étudié et du Gold standard
Sinon :
- étude de cohorte prospective : lorsqu’il s’agit de suivre les patients pour compléter le Gold standard
- étude cas-témoins : utile dans le cas d’une maladie rare ou au stade de développement initial d’un nouveau test (phase II like) : le test est-il capable de discriminer cas et témoins ?
!!! Pas toujours possible d’avoir un test de référence !!!
Etudes diagnostiques : étude diagnostique/dépistage d’impact ?
= une fois que l’on a montré que le test était performant, la question est celle de l’impact clinique réel de la mise en place du test en pratique quotidienne => le CDJ principal est un événement cliniquement pertinent
2 types d’études possibles :
- essai contrôlé randomisé (à préférer ++) : comparaison d’une population avec ou sans la mise en place du nouveau test sur la survenue d’un événement cliniquement pertinent => analyse en ITT (= en intention de diagnostiquer ou en intention de dépister)
- étude observationnelle : équivalent d’étude épidémiologique analytique au niveau méthode, où l’on étudie comme facteur d’exposition “l’exposition au test diagnostique” : à proposer pour un test déjà en place avant le début de l’étude
Etude diagnostique : population étudiée ?
Plusieurs modes de recrutement (à rechercher) :
- systématique et consécutif dans un service = échantillon représentatif avec un spectre de gravité homogène => augmente la validité interne
- patients adressés à un centre de diagnostic pour exploration => rechercher sur quels critères ils ont été adressés
Etudes diagnostiques : critère principal d’évaluation ?
- CDJ principal commun = performance diagnostique du test par les paramètres opérationnels = Se, SP, VPN, VPP, RVP, RVN
Si test quantitatif :
- critère principal = les paramètres opérationnels pour un seuil prédéfini
- critères secondaire = le seuil optimal (ROC), le pearson, le Bland-Altman
Etudes diagnostiques : 5 étapes clés dans la méthodologie ?
=> on compare les résultats avec le test à l’épreuve contre le test de référence : intérêt que si nouveau test moins cher, plus facile, plus rapide…
- un seul échantillon de patients avec suspicion de la maladie
- tous les patients subissent successivement le test à l’épreuve et les tests de référence
- évaluation en aveugle de chacun des tests : classification en M+/M- selon le Gold standard (on considère que c’est la vérité) et classification en T+/T- selon le test à l’épreuve
- calcul des paramètres du test diagnostique à l’épreuve : tableau de contingence +/- courbe ROC
- conclusion : avantage ou non du test, discussion sur la validité externe => la Se augmente artificiellement et donc la RV+ avec
Etudes diagnostiques : paramètres évaluables en fonction de l’écart au protocole réalisé ?
- si le test de référence n’est pas réalisé lorsque le test étudié est positif : évaluation VPN
- si le test de référence n’est réalisé que lorsque le test étudié est positif : évaluation VPP
- si le test étudié n’est réalisé que lorsque le test de référence est positif : évaluation Se
Etudes diagnostiques : paramètres à toujours préciser pour qualifier le test de référence ?
- description précise de la méthode utilisée
- performances, reproductibilité, fiabilité, validité
- standardisation
- valeurs “normales” et “seuil de positivité”, unité
- contrôle qualité
Etudes diagnostiques : résultats dans un essai diagnostique quantitatif ?
- paramètres opérationnels : Se, SP, VVP, VPN, RVP, RVN pour le seuil de définition
- courbe ROC : valeur seuil optimal/aire sous la courbe
- coefficient de corrélation de Pearson (r et p)
- Bland-Altmann : biais systématique
Etudes diagnostiques : nombre de sujets nécessaire ?
= NSN calculé pour obtenir une précision suffisante dans l’estimation des indices de performance diagnostique
- hypothèse sur la prévalence de la maladie
- hypothèse sur la Se ou Sp du test
- hypothèse sur la largeur de l’intervalle de confiance
Etudes diagnostiques : détecter les principaux biais ?
Sources de biais dans l’analyse :
- le nombre de résultats indéterminés ou non interprétables ou aberrants n’est pas mentionné
- le nombre de résultats indéterminés est important
- < 90% des données des patients inclus sont disponibles pour l’analuse
- les analyses en sous-groupes ne sont pas appropriées ou ne sont pas interprétables
- conclure sur l’étude à partir des VPP et VPN (dépendent de la prévalence !!) et non Se ou Sp
- …
Etudes diagnostiques : la réalisation du test va-t-elle modifier la prise en charge du patient ?
- selon le rapport de vraisemblance : qui va entraîner une modification de la prise en charge si ce rapport est suffisamment élevé (RVP) ou bas (RVN)
- selon le seuil diagnostiques au-delà duquel une prise en charge sera proposée
- selon le seuil d’investigation au dessous duquel la pratique d’un test diagnostique n’apportera plus d’élément complémentaire permettant ainsi d’arrêter les investigations
Etudes diagnostiques : tests qualitatifs et quantitatifs ?
Test qualitatif :
- binaire (dichotomique) : positif ou négatif
- nominal : échelle sans hiérarchie
- ordinal : échelle hiérarchique
=> évaluation de la reproductibilité par coefficient de kappa (k)
Test quantitatif :
- toujours une valeur numérique continue
- un problème = valeur seuil normal / pathologique
=> détermination de la valeur seuil par courbe ROC +/- Pearson ou Bland-Altman
Etudes diagnostiques : tableau test diagnostique de dépistage ?
- objectif : dépistage d’une maladie latente pour diminution de la mortalité
- problème de santé publique, prévention secondaire, histoire naturelle connue
- sur une population, dépistage de masse
- Se élevée +++, VPN maximale
- coût faible, rapide, bonne faisabilité, bonne acceptabilité, réconfort des sujets négatifs
- faible validité (nombreux biais), risque de faux négatifs, risque de faux positifs, risques iatrogéniques des tests et des traitements après dépistage, allongement de la période de maladie
Critères justifiant la mise en place d’un dépistage de masse selon l’OMS ?
Critères liés à la maladie dépistée :
- fréquente
- grave
- problème de santé publique
- histoire naturelle connue
- évolution lente avec signes fonctionnels tardifs
- un traitement existe
- pronostic amélioré par un traitement précoce
Critères liés au test de dépistage :
- validité interne du test élevée : test sensible et assez spécifique avec bonne VPN surtout
- reproductible
- acceptable par > 60% de la population : peu invasif, simple
- coût supportable
Critères liés à la population dépistée :
- population cible identifiée et sensibilisée
- population ayant accès aux moyens diagnostiques et thérapeutiques
Etudes diagnostiques : paramètres intrinsèques du test : sensibilité et spécificité ?
= ne dépendent pas de la prévalence +++ mais dépendent du seuil si quantitatif
- intérêt : déterminent la validité intrinsèque du test
- Sensibilité = probabilité d’avoir un test positif si un patient est maladie => aptitude du test à détecter la maladie
- Spécificité = probabilité d’avoir un test négatif si patient sain => aptitude du test à ne détecter que la maladie
- Indice de Youden (aperçu global simultané de la Se et Sp) : Y = Se + Sp - 1
Etudes diagnostiques : paramètres extrinsèques du test : valeur prédictive positive et négative ?
= dépendent de la prévalence +++ => les valeurs évaluées sur l’échantillon sont donc sujettes à cation si la prévalence de la maladie dans l’échantillon diffère de celle de la population générale
- intérêt : déterminent la validité extrinsèque du test
- Valeur prédictive positive (VPP) : probabilité d’être maladie si le test est positif
- Valeur prédictive négative (VPN) : probabilité d’être sain si le test est négatif
4 formules incontournables :
VPP = k x PREVALENCE x RVP (k coefficient fixe)
1 - VPN = PREVALENCE x RVN
VPP = SENSIBILITE x (prévalence avec le test de référence/prévalence avec le test étudié)
VPN = SPECIFICITE x (1 - prévalence avec le test de référence/1- prévalence avec le test étudié)
Etudes diagnostiques : paramètres intrinsèques du test : rapport de vraisemblance positif et négatif ?
= ne dépendent pas de la prévalence +++
- intérêt : déterminent la validité intrinsèque du test
RVP : le patient à RVP fois plus de risques d’avoir un test positif s’il est malade que s’il ne l’est pas
- intervalle des valeurs possibles : entre 1 et l’infini
- important (bon) : RVP > ou = 10
- modérée (moyen) : RVP 5-10
- faible (mauvais) : RVP 1-5
- aucun : RVP = 1
RVN : le patient à RVN fois plus de risques d’avoir un test négatif s’il n’est pas malade que s’il l’est
- intervalle des valeurs possible entre 0 et
- important (bon) : RVP < ou = 0,1
- modéré (moyen) : RVN = 0,1 - 0,2
- faible (mauvais) : RVN = 0,2-1
- aucun : RVN = 1
Théorème de Bayessur nomogramme de Fagan
- p (post-test) = p (pré-test) x RV => VPP = k x prévalence x RVP
- plus le RVP est > 1 plus il augmente la probabilité post-test d’être M+
- plus le RVN est < 1 plus il augmente la probabilité post-test d’être M-
Etudes diagnostiques : paramètres faisant varier les indicateurs de performance ?
Seuil de détection du test :
- si seuil bas = Se, VPN, RVN augmenté, Sp, VPP, RVP baissé
- si seuil élevé : inverse
Stade de la maladie ou quantité d’inoculum :
- si important : Se, VPN, RVN augmenté, Sp, VPP, RVP diminué
Prévalence de la maladie :
- si prévalence haute : alors VPP augmentée et VPN diminue
Test diagnostique qualitatif : principe ?
- indication limitée : pour évaluer des tests diagnostiques qualitatifs uniquement
- reproductible à travers le temps et à travers les expérimentateurs
- pour mesure de la concordance = conformité de plusieurs jugements se rapportant au même objet
- critère faisant varier la validité externe et intenr
- les qualités d’un test sont avant tout sa fiabilité, sa précision et sa reproductibilité intra-essai, inter-essai, et biologique
Test diagnostique qualitatif : reproductibilité intra-observateur ?
- variabilité analytique : variabilité liée à la technique de mesure
- variabilité d’interprétation : variabilité liée à la lecture du test
3 techniques pour mesurer la reproductibilité intra-observateur :
- mesure du coefficient de variation (CV) intra-observateur
- si étude d’une variable qualitative : mesure du coefficient de concordance kappa k qui mesure la concordance intra-observateur en excès par rapport à la concordance attendue par le hasard => reproductibilité d’autant meilleure que k tend vers 1
- si étude d’une variable quantitative : mesure du coefficient de corrélation intraclasse ICC compris entre 0 et 1 (concordance parfaite)
Test diagnostique qualitatif : reproductibilité inter-observateur
- peut être mesurée en comparant des mesures réalisées par des évaluateurs différents
- le coefficient de variation inter-observateur est toujours plus élevé que le coefficient de variation intra-observateur
2 techniques pour mesurer la reproductibilité inter-observateur :
- mesure du CV inter-observateur
- mesure du coefficient de concordance kappa k qui mesure la concordance inter-observateur en excès par rapport à la concordance attendue par le hasard
Test diagnostiques quantitatif : courbe ROC ?
- ROC : Se (ordonnées) en fonction de 1- Sp (abscisse)
- indication limitée : évaluation des tests diagnostiques quantitatifs uniquement
- si ROC médiane ayant 0 pour origine : test sans intérêt
=> identification de la valeur seuil optimal à utiliser pour un test : valeur seuil pour laquelle sensibilité et spécificité sont optimales
- dépistage : on veut Se 100% avec la meilleure Sp possible
- confirmation : on veut Sp 100% avec la meilleure Se possible
=> évaluation de la capacité discriminante globale du test ou comparaison de deux tests : calcul de l’aire sous la courbe
- la valeur de l’AUC > ou = 70-75% pour être valable
- le plus performant est celui dont la courbe ROC s’écarte le plus de la diagonale et dont l’AUC est la plus grande ou la plus proche de 1 => une courbe superposable à la diagonale à une AUC de 0,5 avec un test qui ne fait pas mieux que le hasard
- les courbes ROC permettent d’étudier les variations de la Sp et Se d’un test pour les différentes valeurs du seuil de discrimination
Interprétation des valeurs d’AUC ?
0,9-1 : excellente
0,8-0,9 : bonne
0,7-0,8 : moyenne
0,5-0,7 : médiocre