UA4 Flashcards

(65 cards)

1
Q

Qu’est-ce qu’une variable qualitative?

A

Une variable qui ne peut être mesuré au sens numérique mais peut être classé. (ex.: oui ou non, dichotomique)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qu’une variable quantitative?

A

Une variable qui correspond à une mesure numérique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Comment peuvent être classées les variables quantitatives?

A

Discrètes: Chiffre complet - ex: nombre de personne, de visite à l’hôpital, etc…

Continues

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quels sont les outils utilisés pour rassembler et synthétiser des données statistiques descriptives?

A

Tableaux, graphiques, indicateurs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que la distribution de fréquence?

A

Portrait ordonné de chaque valeur que prend une variable (ou un intervalle de valeurs) et de la fréquence (%) à laquelle ces valeurs sont observées.

ex.: Tableau qui décrit des tranches d’âge et la fréquence d’un risque qui leur est attribué, histogramme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce qu’un histogramme qui a une distribution symétrique et unimodale?

A

Belle courbe en forme de cloche symétrique, sans ‘‘double pic’’

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce qu’un histogramme qui a une distribution asymétrique et unimodale

A

Courbe en forme de cloche ‘‘déformée’’, tend plus d’un côté que de l’autre sans double pic

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce qu’un histogramme bimodale

A

Qui a double pic

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce qu’une variable abérante?

A

Valeur à l’intérieur d’un ensemble de données qui fluctue de manière extraordinaire par rapport aux autres

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelles mesures sont fréquemment utilisées pour décrire les paramètres de position des résultats?

A

Moyenne, médiane et mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelles mesures sont fréquemment utilisées pour décrire les paramètres de dispersion des résultats?

A

Étendue et variance (écart-type)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quels sont les avantages et désavantages d’une moyenne?

A

Avantages: Faciles à utiliser et à calculer
Désavantages: Affectés par les variables aberrantes/extrêmes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quels sont les avantages et les désavantages d’une médiane?

A

Avantages:
* Facile à calculer
* Facile à interpréter
* La médiane est peu affectée par les valeurs extrêmes

Désavantages:
* Peut être fastidieuse à calculer lorsque l’échantillon est grand
* Ne représente que la valeur qui divise l’échantillon en 2 parties, et ne donne aucune information sur les autres valeurs de la distribution
* D’un point de vue mathématique, la médiane est beaucoup moins facile à utiliser que la moyenne pour les tests de signification statistique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que le mode?

A

La valeur de la variable pour laquelle la fréquence est la plus élevée. Le mode est rarement employé seul pour mesurer la tendance centrale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vrai ou faux: Il peut n’y avoir aucun mode dans une étude

A

Vrai ! Si une valeur ne revient pas 2 fois, pas de mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quels sont les avantages et les désavantages d’un mode?

A

Avantages:
* Le mode n’est pas affecté par les valeurs extrêmes
* Peut être calculé sur des variables qualitatives et quantitatives
* Bon indicateur quand une population est hétérogène et
présente plusieurs valeurs dominantes

Désavantages:
* Dans un petit échantillon, il peut ne pas y avoir de mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est-ce que la variabilité?

A

La fiabilité (ou la précision) est indiqué par la variabilité. Plus la variabilité est grande moins la moyenne se rapproche de la valeur réelle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

À quoi servent les paramètres de dispersion?

A

Fournissent une information supplémentaire sur la position
relative des autres points de l’échantillon par rapport à la
mesure de tendance centrale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Comment calculer l’étendue?

A

La différence entre la plus grande valeur et la plus petite valeur des observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Qu’est-ce que la différence de risque?

A

Mesure d’association qui donne une information sur l’effet réel de l’exposition ou excès/réduction de risque attribuable à l’exposition.

= Incidence de l’issue chez les patients ayant reçu le traitement actif - Incidence de l’issue chez les patients ayant reçu le traitement contrôle

Incidence = nb de cas / échantillon total (contrôle ou expérimental)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

EXEMPLE D’INTERPRÉTATION DE DIFFÉRENCE DE RISQUE !

A

Différence de risque :
I(fumeurs) – I(non fumeurs) = 0,83 - 0,33 = 0,50
Le risque supplémentaire de l’infarctus associé au tabagisme est de 50 pour 100

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Comment calculer un NNT?

A

= 1 / (I exposés - I non-exposés) = 1/différence de risque

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Vrai ou Faux: Si NNT = 3,3 , on peut l’arrondir à la baisse, à 3

A

FAUX ! On arrondit à la hausse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Quels sont les avantages et désavantages des NNT?

A

Avantages:
* Résumé utile des résultats
* Utile pour éclairer la prise de décision des médecins et des patients sur les options de traitement
* Relativement facile à calculer

Désavantages:
* Le NNT est basé sur la valeur la plus probable dans une population normalement distribuée - il ne tient pas compte du risque de base individuel d’un patient
* Son interprétation est subjective

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Comment calculer un NNH?
1 / différence de risque
26
Quel biais est évité par la randomisation?
Biais de confusion !! PAS DE SÉLECTION
27
Quel type d'analyse nécessite un ajustement pour les variables confondantes?
L'analyse per protocol !
28
Devrions nous interpréter des variables ajustées ou non ajustées?
Ajustées car moins de biais de confusion, peu importe lequel est statistiquement significatif
29
Quelle est la valeur nulle pour un OR ? Pour une différence/proportion?
OR = 1 Différence/proportion = 0
30
Si on a un résultat non statistiquement significatif, sur quel paramètre devrions-nous nous questionner en premier?
Se questionner sur la taille de l'échantillon
31
Comment on peut savoir si des résultats sont semblables ou non lorsqu'on les compare entre eux plutôt qu'avec la valeur de référence? Ex.: Comparer conséquence 2-3 et 4-5 verres d'alcool ensemble plutôt qu'avec 0-1 (référence)
Regarder les IC ! Si se chevauchent, risques SEMBLABLES
32
Pourquoi n'est-il pas toujours faisable ou recommandé de faire une randomisation?
Considérations éthiques
33
Comment on peut déterminer si la perte au suivi a eu une influence sur les résultats?
On peut comparer analyse ITT avec per protocol. Si différence entre les résultats, alors a des conséquences
34
Comment éviter un biais d'information?
* Le suivi des participants soit identique d’un groupe à l’autre * L’évaluation des issues soit identique d’un groupe à l’autre * Utiliser le plus possible des variables dichotomiques
35
Quel type de régression doit être faite pour un outcome dichotomique?
Régression logistique Dans études per protocol seulement
36
Quel type de régression doit être faite pour un outcome continu?
Régression linéaire Dans études per protocol seulement
37
Quel IC est le plus précis, 95% ou 99%?
95%. Un IC de 99% est nécessairement plus large pour inclure 99% de la pop, mais plus un IC est large, moins il est précis
38
Vrai ou Faux: Un IC de 95% indique qu'il y a 95% de chance que l'estimé de l'échantillon sera compris entre borne inf. et sup. de l'IC
FAUX ! Concerne la population, pas l'échantillon. 100% des résultats sont dans l'IC pour l'échantillon
39
Comment différencier entre 2 résultats lequel est le plus précis?
Comparer les IC. Le plus petit IC est le plus précis
40
Quelle valeur de p value est statistiquement significative
Si p + petit que 0.05 (5%)
41
Qu'est-ce que l'inférence statistique?
Consiste à estimer les caractéristiques inconnues d'une population à partir d'un échantillon issu de cette population. A une certaine marge d'erreur possible
42
Qu'est-ce qu'un intervalle de confiance?
Se définit comme 2 valeurs numériques (bornes) de part et d’autre de l’estimateur ponctuel observé qui définissent une étendue, qui avec un certain niveau de confiance (1 – α) va inclure la vraie valeur du paramètre à estimer.
43
Qu'est-ce qu'une hypothèse?
Une hypothèse statistique peut être simplement définie comme un énoncé (une affirmation) concernant les caractéristiques (valeur des paramètres) dans une ou plusieurs populations
44
Qu'est-ce que le test d'hypothèse?
Démarche ayant pour but de fournir une règle de décision permettant, sur la base de résultats obtenus à partir d’un ou plusieurs échantillons aléatoires, de faire un choix entre deux hypothèses statistiques
45
Quelles sont les étapes de la démarche du test d'hypothèse?
1. Formulation des hypothèses statistiques 2. Choix du seuil de signification α 3. Préciser les présupposées nécessaires à l’application du test 4. Choix de la statistique qui convient au test et l’écart-réduit 5. Établir la règle de décision 6. Calcul de l’écart-réduit 7. Calcul du p-value 8. Interprétation des résultats et conclusion
46
Comment appelle-t-on les 2 hypothèses que l'on émet dans un test d'hypothèse
Hypothèse nulle (H0): Hypothèse que l’on désire contrôler. Elle consiste à dire qu’il n’existe pas de différence entre les paramètres comparés ou que la différence observée n’est pas significative et est due aux fluctuations d’échantillonnage Hypothèse alternative (H1) est la négation H0, elle est équivalente à dire « H0 est fausse ». La décision de rejeter H0 signifie que H1 est vraisemblable.
47
Que représente la variable a (alpha)?
Risque (consenti à priori) de rejeter à tort l’hypothèse nulle H0 alors que celle-ci est vraie, s’appelle le seuil de signification du test et s’énonce en probabilité comme suit: α= Pr(rejeter H0| H0 est vraie) = Pr(choisir H1| H0 vraie) On va choisir normalement α = 5
48
Quelle est l'utilité de la régression linéaire?
Utilisée lorsqu’on veut expliquer la variation d’une variable dépendante (issue) continue à partir de certaines caractéristiques des patients (indépendantes). On veut évaluer la relation entre variable dépendante (ex: pression artérielle) et celles indépendantes (ex: sexe, âge, poids...)
49
Comment FAIRE une régression linéaire?
Les résultats se retrouvent dans un graphique sous forme d'un nuage de point. La régression linéaire forme une droite qui estime le mieux la relation entre les variables
50
Comment calculer l'écart-type?
Racine carrée de la variance
51
Qu'est-ce que la valeur Z
1-a
52
Quelle est la valeur de Z pour a=5%
1,96
53
Quelle est la valeur de Z pour a=1%
2,58
54
Comment calculer l'écart type de la moyenne?
Si la variance est connue, o/(racine de n) Si inconnue, on estime: s/(racine de n)
55
Quelle est la valeur s?
L'écart-type de l'échantillon
56
Qu'est-ce que l'interprétation probabilistique?
Interprétation probabilistique : « Si on sélectionne de façon indépendante plusieurs échantillons à partir d’une population ayant une distribution normale, 95% des intervalles de confiance de niveau 95% vont contenir la moyenne de la population μ. »
57
Qu'est-ce que l'interprétation pratique?
1. «Lorsqu’on sélectionne un échantillon à partir d’une population distribuée de façon normale, on est certain à 95% que l’intervalle de confiance à 95% contient la moyenne de la population μ. » 2. « Lorsqu’on calcule un intervalle de confiance de niveau 95%, on a que 5% des chances que la vraie moyenne de la population μ ne soit pas comprise dans l’intervalle.”
58
Vrai ou faux: Plus n est grand, plus IC est petit
Vrai
59
Vrai ou faux: Plus la variance de X (σ^2) est petite, plus IC est grand
Faux ! Plus la variance de X est grande, plus l'IC est grand
60
Vrai ou faux: Plus α est petit, plus IC est grand
Vrai
61
Vrai ou faux: La largeur de l’IC nous indique la précision de l’estimateur ponctuel
Vrai
62
Vrai ou faux: Le p-value est la probabilité d’obtenir une valeur de la statistique moins extrême que celle qu’on a observée dans notre échantillon en supposant que l’hypothèse nulle est vraie
FAUX ! Le p-value est la probabilité d’obtenir une valeur de la statistique PLUS extrême que celle qu’on a observée dans notre échantillon en supposant que l’hypothèse nulle est vraie
63
Comment inverser un rapport de cote?
1/RC
64
Comment inverser un IC?
1/limite haute ; 1/limite basse
65
Comment déterminer si un rapport de cote représente une association faible ou forte?
Forte si très loin de 1, ex 3.5