Cours 13 : Test de régression Flashcards
(16 cards)
Quelle est l’utilité du test de régression simple ?
- Permet de représenter graphiquement la relation entre les variables par une droite
- Permet de faire des prédictions
- Droite/Équation linéaire
- Permet de connaître la force explicative de la VI sur la VD
→ Coefficient de détermination
Quelle est la formule du test de régression simple ?
Y= a + b(x) + e
- b : la pente
- X : degré de la pente
- a : valeur de la VI quand croise axe Y
Qu’est-ce que la régression multiple ?
- Phénomène = rarement expliqué par une seule variable/prédicteur
- Qu’en est-il de l’effet combiné de plusieurs variables? De l’effet de variables tierces?
→ Est-ce que la combinaison des variables permet d’Expliquer la VD
Quelle est l’utilité de la régression linéaire multiple ?
- Améliore la prédiction de la variable dépendante en prenant en considération l’effet de plusieurs variables indépendantes
→ Permet de connaître leur effet unique ET leur effet combiné (sur la VD)
→ Permet d’inclure des variables contrôle/tierce
- Présence de relations dites artificielles?
→ «Modèle de prédiction»
Quelle est l’équation de la régression linéaire multiple ?
y= a + b1(x1) + b2(x2) + b3(x3) + b4(x4) + … + e
Quels sont les différents types de régression ?
- Régression linéaire multiple : VD = quanti (distribution normale)
- Régression logistique : dichotomique
- Régression logistique multinomiale : Catégorielle (3 gr. ou +)
Quelles sont les types de variables pour une régression linaire multiple ?
VD : quanti
VI : quanti ou dichotomique
Quelles sont les étapes d’un test de régression multiple ?
- Vérifier le respect des postulats d’utilisation
* Variables continues ou dichotomique (variables dummies)
* Vérifier la normalité de la distribution (variables quantitatives)
* Linéarité: inspection du diagramme de dispersion (variables quantitatives)
* Sortir la matrice de corrélation (colinéarité?) - Réaliser la régression linéaire multiple
* Vérification de l’indice de tolérance (multicolinéarité?)
* Minimum des effectifs par variable respecté? - Vérifier si votre modèle est significatif (= effet combinéde vos VI sur la VD)
* Vérifier la force du modèle, le cas échéant - Vérifier le seuil de signification et l’effet unique de chacune. Parmi celles significatives:
* Vérifier le sens de la relation
* Vérifier la force de la relation
* Quels sont les meilleurs prédicteurs? - Présenter et interpréter les résultats
Exemple hypothèse
*Nous testons ici pour la signification d’un modèle (plusieurs variables) et non pour la signification entre une VI et la VD de façon particulière
*Exemple d’hypothèse de recherche:
→ H(1): Le modèle mesurant l’implication dans un mode de vie
→ H(0): Le modèle ne permet pas de prédire le revenu criminel mensuel
Étape 1 : Quels sont les postulats à respecter ?
- Minimum de 20 effectifs par variables
- Normalité de la distribution
→ Analyses univariées et inspection de l’histogramme - Linéarité de la relation entre la VD et les VI quanti
→ Inspection à l’aide du diagramme de dispersion - Absence de colinéarité et multicolinéarité
→ On ne veut pas que les variables soient corrélées (elles doivent être indépendantes les unes des autres) - Absence des variables inutiles
Comment déterminer si les variables ont une colinéarité ou multicolinéarité ?
Colinéarité
→ avec la Matrice de corrélation : vérifier s’il y n’y a pas deux corrélation pearson pareil
Multicolinéarité
→ Indice de tolérance : doit être supérieur à 0.30
Étape 3 : Comment vérifier si notre modèle est significatif ? et la force, le cas échéant ?
- Sig < 0.05 au moins
- Force
- R = Coefficient de corrélation entre le modèle de prédiction et la VD
- R2 = Variation de la VD expliquée par les variables indépendantes inclues dans le modèle (%)
- R2 ajusté = Ajuste pour le nombre de variables inclues dans votre modèle (nb + élevé de VI fait diminuer valeur)
Qu’est-ce que R2
- % de la variation de Y (VD) qui est expliqué par X (VI)
- r2 = chiffre x 100
- Ex. r2 = 0.157 x 100 = 15.7%
Donc, la VI permet d’expliquer environ 16% de la VD
Étape 4 : Comment vérifier le sens et la force des variables significatives ?
- Grâce au coefficient Bêta
- Vérifier la valeur dans le tableau
0 - 0.2 = Faible
0.2-0.5 = Modérée
0.5-0.8 = Forte
Plus de 0.8 = problème possible de colinéarité - Pour déterminer le sens : regarder si coefficient positif ou négatif
Ex. Revenu légitime : Bêta = 0.386
Donc relation positive et modérée
Comment calculer la droite de régression avec SPSS ?
a = constant
b= B tableau
Exemple interprétation test régression ?
VOIR DIAPO!!!!
Une analyse de régression linéaire multiple fut effectuée pour déterminer si l’implication dans un mode de vie criminel permet de prédire la réussite criminelle (mesurée par le Il est à noter qu’aucun problème de colinéarité et multicolinéarité. Les résultats de cette analyse multivariée (Tableau XX) permettent de constater que l’implication dans un mode de vie criminel, tel que mesuré dans la présente analyse, permet de prédire significativement le revenu criminel mensuel déclaré par les répondants (F 2 Il est donc possible de rejeter l’hypothèse nulle selon laquelle le modèle actuel mesurant l’implication dans un mode de vie criminel ne permet pas de prédire le revenu criminel mensuel et de valider l’hypothèse de recherche. Les indicateurs d’implication dans un mode de vie criminel retenus expliquent environ 16% de la variation du revenu criminel déclaré par les participants