Classe 1 Flashcards
(14 cards)
Coupes transversales
Différents sujets à un point précis dans le temps
Série temporelles
Même sujet à différents points dans le temps
Coupes transversales répétées
Différents sujets à différents moments dans le temps
Données de pannel
Mêmes sujets à différents moments dans le temps
B0
est le … lorsque tous les autres facteurs sont 0
B1
représente de combien le … a tendance à changer lorsque … augmente d’une unité en maintenant tous les autres facteurs constants (ceteris paribus)
Quelle est la meilleure ligne
Dont la distance verticale entre les points de données et la ligne est la plus petite en moyenne.
Qui donne les plus petites erreurs de prédiction
Régressions par MCO
trouve une ligne qui minimise la différence verticale moyenne entre la ligne et les données au carré
trouve la ligne qui minimise les erreurs de prédiction au carré
En supposant que:
- Ce que nous n’observons pas est normalement distribué
- Mettre les différences au carré nous donne des chiffres positifs que nous pouvons considérer comme des distances
u
terme d’erreur ou la distance verticale entre la vrai ligne qui a générée les données et les points de données
tout ce que nous n’observons pas ou n’incluons pas dans notre régression
a toujours des effets aléatoires provenant de lui
implique que Y est une variable aléatoire qui a donc une distribution de probabilité
2 types de variables aléatoires
Discrète: ne prennent que certaines valeurs
Continues: peuvent prendre presque toutes les valeurs dans un intervalle
Espérance
La variable la plus probable d’une variable
Valeur moyenne de x; E(x)
E(ylx=2); valeur moyenne de y quand x=2
Variance
Capture la dispersion des données
Var = E[(Y-E(Y))**2]
somme de (X- moyenne de X)**2/N
Covariance
somme de (X-moyenne de X)(Y-moyenne Y)/N