Régression multiple Flashcards

(30 cards)

1
Q

Quel est le but de la régression multiple?

A

Évaluer le degré de relation entre plusieurs prédicteurs et la VD

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Combien de variables y-a-t-il en régression multiple?

A

Au moins 2 VI/prédicteurs et 1 VD/critère

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Comment sont les VI en régression multiple?

A

D’échelle continue ou nominale dichotomique (dummy/factice)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Comment est la VD en régression multiple?

A

Continue!!!

*Si dichotomique = régression logistique (pas dans cours)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Que se passe-t-il lorsqu’on ajoute des variables prédictives?

A

On augmente la précision de l’estimation de la VD en diminuant la variance inexpliquée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelles sont les deux étapes principales de la régression multiple?

A
  1. Déterminer la variance expliquée par l’ensemble des VI (R et R2)
  2. Déterminer quels sont les prédicteurs significatifs
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quelle est l’équation de la régression linéaire SIMPLE?

A

Ŷ= a + bX

Ŷ: VD critère prédite
X: prédicteur
b: pente de la droite de régression
a: ordonnée à l’origine

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce qu’un résidu dans la droite de régression?

A

Distance entre point (score observé) et ligne (score prédit): Y - Ŷ

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelle est l’équation de la régression multiple?

A

Ŷ = a + b1X1 + b2X2 + … +bpXp

p: nombre de prédicteurs

**Inclure pente et X de chaque prédicteur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment est formulée l’hypothèse de la régression multiple?

A

H1: Au moins 1 B diffère de zéro
H0: Aucun B diffère de zéro

*Mais possible d’en faire une pour chaque prédicteur (ex: la faible proximité est liée à un plus grand degré d’insatisfaction conjugale)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

En sciences humaines, environ combien de % maximum est expliqué par un prédicteur?

A

30-40%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quels sont les postulats à vérifier pour la régression multiple?

A

1.Taille de l’échantillon
2. Absence de multicolinéarité
3. Normalité des résidus
4. Absence de valeur extrême multivariée
5. Homoscédasticité et linéarité des résidus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Comment vérifie-t-on le postulat de la taille de l’échantillon?

A

Taille doit être suffisante pour le nombre de prédicteurs (p)

-Calcul dans G*power à priori
OU
-N > 20 x p (tabarchnick et fidel)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment vérifie-t-on le postulat de l’absence de multicolinéarité et de singularité?

A

Dans le tableau de corrélations dans SPSS:
s’assurer que les VI ne sont pas trop corrélées entre elles (r plus petit que 0,7)
-Rapporter la plus basse et la plus haute (montre que tous en dessous de 0,7)

*absence de singularité (PAS r = 1)

**Solution: éliminer une variable si 2 sont trop semblables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Comment vérifie-t-on le postulat de normalité des résidus?

A

APRÈS L’ANALYSE!
Crée variable ZRES_ pendant l’analyse et faire normalité après

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Comment vérifie-t-on le postulat de l’absence de valeur extrême multivariée?

A

Pour s’assurer qu’il n’y a pas de valeurs extrêmes:

Convention: Distance de Cook (VI et VD)
-S’assurer que valeur MAX < 1 (si plus grande, tester sans car peut changer l’analyse)

SINON faire les deux:
-Résidus standardisés (VD: s’assurer que min et max dépasse pas 3)
-Bras de levier (VI: s’assurer que MAX < 3(p+1)/N)

17
Q

Comment vérifie-t-on le postulat d’homoscédasticité et linéarité des résidus?

A

Vérifie que la relation entre VD prédite et résidus est linéaire et égale tout au long de la droite

*À l’aide d’un diagramme, on cherche un biscuit au chocolat des résidus standardisés (ZRESID) autour des scores prédits standardisés (ZPRED)

17
Q

Comment vérifie-t-on le postulat d’homoscédasticité et linéarité des résidus?

A

Vérifie que la relation entre VD prédite et résidus est linéaire et égale tout au long de la droite

*À l’aide d’un diagramme, on cherche un biscuit au chocolat des résidus standardisés (ZRESID) autour des scores prédits standardisés (ZPRED)

18
Q

En quoi consiste le R?

A

Coefficient de corrélation multiple (pas utile)

19
Q

En quoi consiste le R2?

A

Coefficient de détermination (R2): exprime le % de variance expliquée par l’ensemble des prédicteurs
*R2 ajusté est moins biaisé = prioriser

*5% de variation bien en psycho

20
Q

À quoi sert le test F dans la régression multiple?

A

Teste H0 omnibus (tous les B = 0): permet de déterminer si la variance expliquée par VI est supérieure à la variance inexpliquée

*Si au moins 1 B diffère de 0 = rejet H0
**On interprète pas le F

21
Q

À quoi sert le test t dans la régression multiple?

A

Tester la signification (p < 0,05) de chaque prédicteur
*Utilise B standardisé pour l’interprétation

22
Q

Que faisons-nous après avoir déterminé les prédicteurs significatifs de la régression multiple?

A

Il faut calculer le % de variance unique de chaque prédicteur sig:
-Taille de l’effet: trouver la corrélation semi-partielle et mettre au carré (sr2)

23
Q

Sur quoi repose la décision statistique de l’analyse de régression (globalement)?

A

Sur le test F!! Si significatif = au moins 1 prédicteur qui diffère de 0 (rejet H0)

24
Que devons-nous inclure dans la rédaction de la régression multiple?
-Notation F: F(ddl) = 123, p < 0,005 -R2aj = 0,123 (12% de variance expliqué) -Coefficients de régression de X (B = 123, p < 0,001, sr2 = 123) *rapporte aussi b et p des prédicteurs non significatifs mais pas sr2
25
Vrai ou faux: les prédicteurs prédisent le critère?
FAUX!! Ce n'est pas une causalité, c'est un lien DONC peut dire qu'associé ou relié
26
Que signifie un bêta négatif?
Signifie que la relation va dans le sens contraire
27
En quoi consiste la régression multiple standard?
-Les variables sont entrées simultanément dans l'analyse -Permet de connaître % de variance UNIQUE (sr2) de chaque VI = sait la contribution de chaque VI
28
En quoi consiste la régression multiple hiérarchique (séquentielle)?
Variables sont entrées selon un ordre prédéterminé par le chercheur: a) Variables contrôles puis variables à l'étude OU b) Variables plus importantes puis secondaires OU c) Variables documentées puis nouvelle variable **Permet de voir le % de variance expliqué ajouté par la 2e VI
29
En quoi consiste la régression multiple statistique?
SPSS décide de l'ordre d'entrée des données sur la base des données (par sélection, par élimination, pas à pas) *Plus en exploratoire **Minimum 40 participants par VI