Classe2 Flashcards
(12 cards)
Valeur prédite
La ligne que j’estime
y^=B0^+B1^x
Résidus
La différence entre vrai point et la ligne que j’ai prédit
û = y - y^ = y - B0^ - B1^x
Terme d’erreur
Différence entre vrai point et vrai ligne
u = y - B0 - B1x
Résidu = terme d’erreur juste si nos estimateurs sont exactement égaux aux vrai paramètres
Avec N observations = 1/N * somme de (y-B0-B1*x)**2
SST (Somme totale des carrés)
somme de (y-moyenne de y)**2
variance des données
SSE (Somme des carrés expliquée)
somme de (y^ - moyenne de y)**2
variance de mes prédictions
SSR (Somme des carrés résiduelle)
û**2
Identité avec SST, SSE ET SSR
Variance totale = Variance expliquée + Variance qu’on peut pas expliquer
SST = SSE + SSR
R**2
R**2 = SSE/SST = 1- SSR/SST
= La variance de mes prédictions / la variance des données
Plus qu’il est élevé, mieux c’est
B1^
(Correlation dans l’échantillon entre X et Y)*(Ratio des écarts-types)
Est causales que sous certaines hypothèses
4 hypothèses à respecter pour savoir si B1^capture bien la relation entre x et y
(Hypothèses du modèle de régression linéaire simple)
SLR.1: y = B0 + B1*x + u ; la vrai relation entre y et x est en effet linéaire dans les paramètres
SLR.2: (y,x) : i=1,…N ; est un échantillon aléatoire
SLR.3: (x): i = 1, …, N ; n’ont pas tous la même valeurs/x varie
SLR.4: E(ulx) = E(u) = 0; L’erreur moyenne ne dépend pas des valeurs de x
Biais de variables omises
Quand on surestime ou sous-estime systématiquement le vrai effet moyen d’une variable en raison de l’omission d’autres variables importantes
Si E(B1^lx) = B1; Pas de biais car en moyenne, on trouve le vrai effet
B1^ est sans biais si
- côv (x,u) = 0
ou - E(ulx) = E(u) = 0