Régression linéaire multiple Flashcards

1
Q

Que reitre la regression multiple ?

A

la variance expliqué (R2) qui est commune aux deux variables, permet avoir apport expli propre de chaque variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Les postulats 1 et 2

A
  1. Postulat lié spécifie du modèle
    Modèle = correctement corrélé (aucune variable importante oublié, non importante ajoutée)
    Sinon : diminution du R2, rela fallacieuse (concept verrait important alors qu’il ne l’est pas), rel improbable.
  2. Postulat erreur de mesure
    Variable = correctement mesurées
    Abs d’autocorrélation, l’autocorrélation temporelle est la + fréquente
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Les postulats 3 et 4

A
  1. Postulat relatif au terme d’erreur
    Les variables importante ne sont pas corrélées ac T E. Si oui, alors pb spé modèle.
    Le T E est normalement distribué
    Variance d’erreur est constante pour les valeurs de X : homocédas
  2. Abs de colinéarité ou multico parfaite. Si p supérieur à 0,8 alors pb.
    Pour détecter, régresser chaque prédic entre eux et si valeur de R2 approche 1, alors pb.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Pourquoi est-il important de s’assurer de l’erreur de prédiction

A

Elle doit être distribuée normalement, car les postulats en dépendent.
Menu plot de le regression et sortir l’histograme.
Pour voir si erreur des prédicateurs est corrélée ac VD : menu save, standardized résiduel, créer new variable et on peut faire corréler ac cette nouvelle variable et la VD

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Les questions à se poser :

  1. Le modèle fonctionne-t-il? Peut on prédire VD ac VI?
  2. Si modèle utile pour prédire VD, quelle est sa valeur prédicatrice? Quelle est la proportion de la variance expliquée par prédicateur
  3. Quels sont les prédic les + puissants
A
  1. Regarder le ration F, qui test que tous les clef sont de 0, donc regarder sig F de l’Anova.
  2. Tableau sommaire du modèle (R square)
  3. Tableau sommaire reg puis regarder le BETA, car les score sont comparables entre eux.
    Le b est utile si on veut prédire le score pour un sujet en particulier. Il est non standardisé.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Pourquoi utiliser la reg logistique ?

A

Car va mieux ac variable dicho, car asymptotique, le passage d’1 niveau à l’autre se fait + rapidement qu’en linéaire.
Aussi, régression logistique car tableau croisé peuvent pas traiter + d’1 prédicateur à la fois, ni estimer s’il existe effet d’intéraction entre les prédicateurs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Postulats

A
  1. Variable dicho, relation logistique
  2. Spécification du modèle ; s,assurer qu’aucune variable importante n’a été omise, et non pertinente ajoutée.
  3. Pas de multicolinéarité
  4. Minimum de 10 participants par prédic
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qualité du modèle

A
  1. Chi2 indique si le modèle est significatif, + il est élevé et + on est content.
  2. -2 log de likelihood: calcul la taille de l,effet de chaque variable.
  3. Hosmer et Lemeshow : goodness of fit: doit être non significatif
  4. Le % de bonne classification : + il est élevé et mieux c’est.
  5. Coef Wald : la variable à t-elle un apport prédic significatif?
  6. Exp(b) : varie de 0 à l’infini. Il est non stnadardisé, donc il faut faire le R-statistique.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly