COURS 11: La régression linéaire Flashcards
Quelle est la différence entre la corrélation et la régression?
Corrélation : établir la relation entre 2 variables
Régression: Prédire la valeur d’une variable (Y) à partir d’une autre variable (X)
V/F Lors de la régression, un lien de causalité est établi entre la valeur X et Y.
FAUX
Lors de la régression, quel nom donne-t-on à la variable dépendante et indépendante?
VI: Variable prédictrice (X)
VD: Variable prédite (Y)
V/F La variable prédictrice peut devenir la variable prédite et vise-versa
Vrai, puisqu’elles ne sont pas causales
Sur quoi repose la qualité de la prédiction d’une régression?
La force de la relation linéaire (avec une corrélation parfaite, on aurait une prédiction parfaite).
V/F La droite de régression n’est pas la droite qui permet de faire la meilleure prédiction de Y à partir de X.
Faux, c’est la droite qui permet la meilleure prédiciton
La droite de régression ……. l’erreur et passe par un ……. de points.
- Minimise
- Maximum
V/F La droite de régression passe par la moyenne des points du diagramme de dispersion.
VRAI
V/F Il existe une infinité de droite de régression pour un nuage de points.
FAUX, il existe une infinité de droites, mais seulement une seule droite de régression.
Donne l’équation de régression
Ŷ=bx + a
Ŷ: valeur de Y prédite
X: valeur du prédicteur (connu)
b: pente de la droite de régression (coefficient de régression)
a: ordonnée à l’origine (constante)
Donne 2 propriété de la droit tracée par l’équation de régression.
- Minimise les distances entre la droite et les points
- Permet la meilleure prédiction de Ŷ à partir de X
V/F Avec la régression linéaire multiple, il y aurait plusieurs prédicteurs, tandis qu’avec la régression linéaire simple il n’y a qu’un seul prédicteur.
VRAI
V/F Même avec une corrélation parfaite, le Ŷ diffèrera du Y réel.
FAUX, il sera identique (aucune erreur). En absence d’une corrélation parfaite, les Y réels seront en dessous ou au dessus de la droite de régression.
Donne la formule qui donne l’erreur de prédiction.
Erreur de prédiction = Y - Ŷ
V/F L’erreur de prédiction peut aussi être appelée résidu
Vrai
En régression, on cherche la droite qui …… les résidus.
minimise
Lors du calcul de la droite, on cherche à minimiser Σ(Y-Ŷ)^2. Pourquoi met-ton la somme des différence au carré?
Pour ne pas avoir une somme de 0, ce qui produirait si on additionnait seulement les écarts par rapport à la moyenne.
Comment calcule-t-on le b de la droite de régression/ le coefficient de régression?
b= COVxy/Sx^2
Quelle est la différence entre la formule du coefficient de régression et celle du coefficient de corrélation?
1.Régression : divisée par Sx^2
2. Corrélation: divisé par Sx * Sy
Comment calcule-t-on le a de la droite de régression?
a= Y-bx
Quelle est la signification de l’ordonnée à l’origine (dans certains contextes)?
Utile lorsqu’on veut connaître le niveau de base d’une valeur. Ex: si on prédit le temps de réaction avec alcool, l’ordonnée à l’origine indique le temps de réaction SANS alcool.
- Attention, l’ordonnée à l’origine n’a pas toujours de signification particulière.
Qu’elle est la signification du coefficient de régression (b)?
Le nombre d’unités de changement de Ŷ en fonction d’UNE unité de X.
Que signifie β?
Le coefficient de régression STANDARDISÉ. En régression simple, β = r (coefficient de corrélation). Changement Ŷ de en fonction d’un écart-type.
Pourquoi utiliser β au lieu de b?
- Indépendant de l’échelle de mesure
- Utile pour comparer l’importance relative de différents β (plusieurs variables prédictrices en régression multiple).