Régression linéaires Flashcards
(11 cards)
Qu’elle est l’objectif de la régression et elle fait quoi?
B) Sa pertinence
La prédiction de tel phénomène si la tendance se maintient (que le coefficient ne varie pas).
C’est un test de prédiction avec plusieurs variable qui vas prendre en considération tout les point de dispersions de façons minimiser les écarts entre les points pour créer un seul et même modèle de prédictions à plusieurs variables.
B) la pertinence : un phénomène humain n’est jamais du à une seule variable, dont pour prédire un phénomène, ont doit utilisé plusieurs variable et prendre en compte celle qui ont des effets de contrôle (lorsqu’il problème de variable tierce
Nommer la formulle et que veut dire chaque lettre?
y = a + b(x) + e
y = la valeur de prédites de la VD
a= la contante/l,intersection ( la valeur de y lorsque X est à 0)
b = le degrés la pente (pour chaque augmentation y, X vas augmenter en fonction du b).
x = la valeur de la Variable indépendante
e = l’erreur résidiuel, résidu, terme d’erreur
Nommer les trois type de régression
1) régression linéaire multiple
–> VD est quantitatives et normalement distribué.
2) Régression logistique
–> VD est dichotomique
3) Régression logistique multinomiale
–> VD est catégorielle (3 gr et +)
Les postulats de la régression linéaire
B) les deux variable pouvant être incluse
postulats
1 - les variable quantitative sont normalement distribué
2 - les relation son tous linéaire
3 - absence de colinéarité (matrice de corrélation) et multilinaérité (indice de tolérance supérieur à 30.
4 - Minimum de 20 cas effectif (n/nombre de vr dans le modèle doit être supérieur à 20).
B) seulement des Vr quanti ou dichotmique peuvent être utilisé dans un modlèle de régression linéaire.
Comment vérifier la colinéarité?
les colinéarité sont lorsque les R ou les RHO sont trop élevé, ce qui veut dire que ça est trop en lien pour un évennement. mais en science sociale, ça fonctione pas de même.
Si les vr sont trop relié entre elle ( > 0.8), il est impossible distinguer un effet spécifique entre les vr présents dans le modèle,
Comment vérifier la multilinéarité
selon l’indice de tolérance présent dans le tableaux “coefficient”. l’indice varie entre 0 et 1, et plus le nombre est proche de 1, et plus la vr est associé.
La vr devient problématique sir l’indice de tolérance est en dessous de 30.
comment déterminer si un modèle est puissant
1) les Vr présent sont indépendante
2) Les vr sont fortement associé à la VD
après les test de co et multi, on vérifie la signification de chaque variable, et on présente seulement les vr qui sont significative
c’est quoi une hypothèse de régression linéaire
On test seulemement la signification de la prédiction d’un modèle et non la signification de deux vr
H1 : le modèle permet de prédire le revenu criminel selon l’effet subi du contrôle pénal. il est attendu que plus un individu est contrôlé et plus son revenu criminel sera faible.
À quoi sert le tableaux de L’anova et le model summary?
le tableaux prmet de de connaitre :
1) la valeur de F = un chiffre que à lui seul ne veut rien dire, mais c’est la valeur attribué au modèle
2) le P de L,entièreté du modèle, (toute les variables significative combiné).
3)le degré liberté total (à inclure dans la formule de présentation
4) le modèle summarry est bon pour connaitre le R2 = l’indice e force explicatif du mdèle qui suit la même logique que la corrélation
le R2 peut prédire la variation à temp de %
Comment savoir laquelle Vr est la plus prédictive ?
Dans le tableaux nommer “coefficient” (le tableaux de l’indice de tolérance)
1) Vérifier le seuil de signification et l’effet unique de chacun de nos VI. PARMIS celle qui sont signifcatives (On vérifie la force seulement si c,est significatif.
2) on observe la signification du Béta, car ce dernier indique le sens et la force prédictive (un % comme le r) de chaque VI présent dans la modèle. La variable avec le béta le plus fort est celle qui est la plus prédictive.
Comment comprendre des variables dichtomique selon une régression?
C’est toujours la deuxième catégorie, celle qui est plus élevé lors de la codification, qui est prédites. Donc la valeur prédictive au sein du modèle vas toujours dire que la VI influence à tant de % selon la VD.
Par exemple, la prison me dissuade du crime, la deuxième catégorie créer est “non” et le bêta est de 0.13%. Alors cela vait dire que ceux qui ont répondu non voit leur revenu criminel augmenter ( à cause du symbole positif). On peut donc dire que ceux ayant répondu non voit leur revenu criminel augmenter alors que ceux ayant répondu oui ont leur revenu criminel érduit. Cette relation est prédite à 13%.