Module 6 - Corrélation Flashcards
Quels sont les [3] différentes approches d’analyse statistiques?
- Approche univariée: situations où une seule variable est considérée.
- Approche bivariée: situations où deux variables sont considérées simultanément (déterminer la corrélation entre deux variables)
- Approche multivariée: situations où plus de deux variables sont considérées simultanément.
Quelles [4] situations n’existe t-il aucune conclusion de cause-à-effet?
- Lorsque X est la cause de Y.
- Lorsque Y soient la cause de X.
- Lorsqu’une autre variable liée à la fois à X et à Y explique le lien entre ces variables.
- Lorsque la corrélation est seulement due au hasard.
[3] Caractéristiques d’une corrélation POSITIVE
- Plus les scores de X augmentent, plus les scores de Y augmentent également.
- Plus les scores de X diminuent, plus les scores de Y diminuent également.
- Diagonale du bas gauche à droite
[3] Caractéristiques d’une corrélation NÉGATIVE
- Plus les scores de X augmentent, plus les scores de Y diminuent.
- Plus les scores de X diminuent, plus les scores de Y augmentent.
- Diagonale du bas droit au gauche
[3] Caractéristiques d’une corrélation NULLE
- Aucune relation linéaire entre les deux variables.
- Ne signifie pas qu’il n’existe aucun lien entre les variables.
- Possible que le lien présent soit de nature non linéaire.
Qu’est que le coefficient de corrélation (r)?
Une mesure standardisée de la force de la relation linéaire entre deux variables.
[3] caractéristiques du coefficient de corrélation (r)
- Les coefficients négatifs impliquent des corrélations négatives.
- Les coefficients positifs impliquent des corrélations positives.
- Un coefficient de zéro correspond à une corrélation nulle.
Que représente la valeur du coefficient de corrélation?
La taille de l’effet, c’est-à-dire la force de la relation entre les variables, indépendamment du sens du lien.
Taille de l’effet - Corrélation [5]
- Nul: 0
- Faible: 0.25
- Moyen: 0.50
- Fort: 0.75
- Parfait: 1.00
Qu’indique la covariance? (COV)
À quel point les données sont aplaties le long de la diagonale.
Qu’est-ce que le coefficient de détermination (r-au-carré)? [2]
- Représente la proportion de la variation d’une variable qui est expliquée par l’autre variable.
- Permet de calculer la variance partagée.
Qu’est-ce que la corrélation partielle?
- Permet de calculer la corrélation entre deux variables en contrôlant pour l’effet potentiel d’une troisième variable.
- Nous devons donc contrôler pour cette 3ème variable, c’est-à-dire enlever au lien XY toute la partie qui peut être attribuée à la 3ème variable.
Qu’est-ce que la régression linéaire? [2]
- Permet de vérifier la relation linéaire entre deux variables.
- Permet d’estimer de quelle quantité la VD sera modifiée en cas de changement de la VI
Qu’est-ce que l’équation de régression? [6]
- Permet de faire une prédiction
- y = a +bx
- y = score prédit de VD
- x = score de VI
- a = ordonnée à l’origine (valeur de y quand x = 0)
- b = pente de la droite de régression
Comment interpréter « b » dans l’équation de régression? [4]
- Si b > 0, la relation est positive.
- Si b < 0, la relation est négative.
- Si b = 0, la relation est nulle
- Plus b est grand, plus x a d’effet sur y.
Quels sont les résidus? [3]
- Des erreurs de prédiction
- Lorsqu’il y a un écart entre la prédiction (y chapeau) et la valeur observée (y).
- On conclut que « L’écart entre la valeur prédite (…) et la valeur observée (…) s’explique par le fait que la corrélation est imparfaite. »
Qu’est-ce que la régression linéaire multiple? [3]
- Utilisée lorsque plus de deux VIs (x1, x2, x3, etc.)
- Permet de décrire l’effet de toutes les VIs dans leur ensemble sur la VD.
- Permet également de décrire l’effet de chacune des VIs séparément des autres.
Quels sont les [5] conditions d’application d’une régression linéaire multiple?
- Vérifiez toujours que vous avez assez de participants.
- La VD doit être distribuée normalement dans la population.
- Les VIs doivent être linéairement liées à la VD.
- Les valeurs extrêmes doivent possiblement être éliminées.
- La colinéarité entre les VIs n’est pas souhaitée.
1ère condition d’application de la régression linéaire multiple [3]: VÉRIFIEZ ASSEZ DE PARTICIPANTS
- Pour étudier l’effet global des VIs sur la VD: tableau ANOVA
- Pour étudier les effets des différentes VIs prise individuellement: tableau Coefficients
- Si on étudie à la fois l’effet global et l’effet individuel des VIs, on prend le plus grand des deux nombres.
2ème condition d’application de la régression linéaire multiple: VD DOIT ÊTRE DISTRIBUÉE NORMALEMENT
Les VIs n’ont pas besoin de suivre une loi normale, seulement la variable dépendante.
3ème condition d’application de la régression linéaire multiple: VIs DOIVENT ÊTRE LIÉES LINÉAIREMENT AUX VDs
Si les variables indépendantes et la variable dépendante ne sont pas liées linéairement, alors la régression n’a pas grand sens et ne mène à rien.
4ème condition d’application de la régression linéaire multiple: ÉLIMINER VALEURS EXTRÊMES
Les valeurs extrêmes ont une très grande influence sur les résultats.
5ème condition d’application de la régression linéaire multiple [3]: ON VEUT PAS DE COLINÉARITÉ ENTRE LES VIs
Ce qu’on veut:
- Corrélation forte entre la VD et chacune des VIs.
- Corrélations faibles entre les différentes VIs.
- On parle de colinéarité dans le cas où on a des corrélations de 0.80 et plus entre les VIs.