Final Flashcards
(41 cards)
Hvem er Ben Bolker?
Who the fuck knows
Hvornår oplever man endogenitet? (angiv 1-2)
- Udeladte vigtige variable
- Misspecifikation af den funktiopnelle form
- Simultanitet
- Målefejl i regressorer
Hvornår er en forklarende variabel endogen?
Når den er korreleret med fejlledet.
Hvad er en proxy-variabel og en instrument?
En proxy-variabel bruges i det tilfælde, at man ikke kan måle en specifik parameter, derfor bruges en man forventer er korreleret med variablen.
Et instrument skal være korreleret med x og kan derved bruges til at finde x*, der er eksogen.
Hertil, så er et instrument ukorreleret med fejlledet, men det er en proxy ikke (det er meningen, at den ikke skal være det).
Hvornår bruges IV og hvad skal den opfylde efter?
x endogen, z IV for x
Cov(x, z) /= 0 (IV relvans)
Cov(z, u) = 0 (IV skal være endogen)
Hvorfor er endogenitet dårligt?? (hvorfor giver vi en fuck)
Fordi det gør estimater biased og inkonsistente
Hvis z_1 er en kandidat til et instrument for x_K (endogen), vil en proxy så være et godt bud på z_1?
Nej, eftersom vi kræver, at z_1 er ukorreleret med fejlledet, hvilket en proxy ikke skal være.
Hvis en forklarende variabel er bestemt simultant med
den afhængige variabel, er den generelt korreleret med
fejlene.
Hvad gælder for OLS?
Den er biased og inkonsistent.
Hvordan tester man Cov(u, z) = 0 og Cov(z, x) /= 0?
Husk at fejlledet u er uobserveret.
(z IV for x som er endogen)
Man kan generelt set ikke teste Cov(u,z) = 0. Man får inkonsistente estimater, hvis man regresserer z på u^hat (OLS residualer), fordi disse er fremskaffet, med en x, som er endogen.
Cov(z,x) /= 0 kan testes ved at gøre følgende:
Estimer x = pi_0 + pi_1z + nu
Dermed er pi_1 = Cov(x,z)/Var(z). Man kan altså teste
H0: pi_1 = 0
HA: pi_1 /= 0
Hvad kalder man følgende ligning:
x_K = \delta_1 + \delta_2 · x_2 + … + \delta_(K-1) · x_(K-1) + \theta_1 · z_1 + r_K
Reduceret form-ligningen
Hvad er svage instrumenter (weak instruments)?
Instrumenter, der har en lav korrelelation med x.
Hvad er konsekvensen af svage instrumenter (weak instruments), hvis der bare er en lille korrelation mellem z og u?
Det kan hurtigt føre til inkonsistens og bias, da Corr(z,u)/Corr(z,x) hurtig kan blive stor.
Hvis z_1 er en kandidat til et instrument for x_K, hvad kræver vi så af korrelationen mellem de to?
At den er forskellig fra 0.
Hvad kalder man IV-estimatoren med multiple instrumenter?
Two Stage Least Square (2SLS)
Er standardfejl for 2SLS større, mindre eller lig standardfejl for OLS?
Standardfejl for 2SLS er større.
Opskriv formlen for R^2.
Hvad ved vi om R^2 i tilfælde med IV?
R^2 = 1 - SSR/SST
I visse tilfælde kan SSR>SST, hvorved R^2<0. Af den grund er det ikke tydeligt om R^2 bør rapporteres ved IV.
Hvad sker der med den asymptotiske bias for IV, hvis x og z kun er svagt korrelerede?
Den kan blive stor.
Angiv 2SLS.1 - 2SLS.4
De fire første antagelser for two stage least squares.
Hvad gælder for 2SLS estimatoren, under disse antagelser?
2SLS.1: Populationsmodellen er lineær i beta (samme som OLS antagelse 1)
2SLS.2: Random sampling
2SLS.3: Rank condition; 1) ingen perfekt lineær sammenhæng mellem z_i’er, 2) Den relevante z_i er ‘identificeret’
2SLS.4:
z_i’erne er exogene. De er altså ukorreleret med fejltermet.
Estimatoren er konsitent under 2SLS.1 - 2SLS.4
Der er yderligere to antagelser:
2SLS.5:
Homoskedasticitet af fejl, betinget på z_i’er er konstant -> 2SLS er efficient (bedste IV estimator) og den er asymptotisk normalfordelt.
2SLS.6:
Ingen seriel korrelation (kun brugt i panel data)
Hvad kalder man den størrelse, der beregnes som:
1 - SSR/SST
R^2
Kan R^2 være negativ for IV? Hvis ja, hvordan kan dette rent matematisk lade sig gøre?
Ja, det kan R^2 godt. Dette skyldes, at SSR for IV kan være større end SST.
Hvad prøver OLS at maksimere?
R^2.
Regressions baseret test (Hausman)
opstil: y1 = b0+b1y2+b2z1+b3z2+d1v\hat2+error Test: H0: d1=0, HA: d1≠0. Hvis signifikant er y2 endogen.
‘R-kvadrat’?
Nej, ‘R i anden’.
You dumb bitch
DWH AKA Durbin-Wu-Hausman test (kommer nok ikke til eksamen, da den er meget svær).
Hvis alle regressorer er eksogene under H0, men nogle
er endogene under H1, kan vi basere en test direkte på
forskelle mellem 2SLS og OLS estimater.
Teststørrelsen er (hat over alle parametre):
(b2SLS-bOLS)’[(X’X)^-1 - (X’X)^-1]^- (b2SLS-bOLS)/s^2_OLS
som er chi-i-anden fordelt med G1 frihedsgrader, hvor G1 er antallet af endogene regressorer. H^- er den generaliserede inverse af H