Regressie analyse Flashcards

1
Q

Wat is een deterministisch model?

A

Model wat met 100% juistheid kan voorspellen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat doet een regressie analyse?

A

Een regressie analyse schat relaties tussen 1 afhankelijke en 1 onafhankelijke variabele

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat zijn de voorwaardes voor een regressieanalyse?

A

Zowel afhankelijke als onafhankelijke variabelen moeten van minimaal interval meetniveau zijn
Onderzoeksvraag moet verklarend zijn

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Een schatting moet BLUE zijn, wat houdt dat in?

A

Best (effeciëntie) Linear Unbiased (zuiverheid) estimator

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat is de formule van een regressiemodel?

A
Y= B0 + B1 Xi + ei
Y = te verklaren variabele (afhankelijke variabele)
X = verklarende variabele
B0 = Snijpunt met de y-as (hier start de lijn)
B1 = Helling van de lijn (toename.afname in deterministisch component voor y voor elke toename van 1 eenheid in x)
B0+B1 = deterministische deel van formule
e = toevallige afwijking (aselecte error)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat zijn de stappen van de regressieanalyse?

A
  1. Hypothetiseer regressie coëfficienten
  2. Schat modelparameters
  3. Check verdeling variabelen
  4. Check modelassumpties
  5. Schat definitieve model
  6. Evalueer model
  7. Interpreteer bevindingen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat zijn de assumpties van de regressieanalyse?

A
  1. Variabelen zijn van interval meetniveau
    (gaat met name om de afhankelijke variabele, onafhankelijke kan ook ander meetniveau zijn, dan gebruik maken van dummy’s)
  2. Variabelen zijn normaal verdeeld
    (skewness, kurtosis of pp plot)
  3. Relatie tussen de afhankelijke variabele en elk van onafhankelijke variabelen is lineair
    -> Rechte lijn
    P > 0.05 (niet sign.)
  4. Multicollineariteit = de samenhang tussen de onafhankelijke variabelen is niet te hoog
  5. Homoscedasticiteit = de variantie rondom de geschatte waarden van y is voor alle (combinaties van) waarden van x (-en) gelijk
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wanneer is een verklaringskracht hoog of laag?

A

Lage verklaringskracht = 0.01
Middel verklaringskracht = 0.09
Hoge verklaringskracht = 0.25

Kijk naar adjusted R square

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat is kurtosis en wanneer is er sprake van?

A

Steilheid van variabele;
sprake van kurtosis wanneer Kurtosis/SE kurtosis > 2

Bij negatieve kurtosis is de lijn vlakker, bij positieve kurtosis steiler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat is skewness?

A

De scheefheid van de variabele
wanneer mean afwijkt van mediaan
er is sprake van skewness wanneer skewness/SE skewness > 2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Bij stap 6; het evalueren voer je meerdere stappen uit, welke stappen zijn dit?

A
  1. Bruikbaarheid controleren
    -> kijken of het significant is met een F-toets
    h0: Het model is niet bruikbaar om de afhankelijke variabele te voorspellen
    H1: het model is wel bruikbaar o, de afhankelijke variabele te voorspellen
    P < alfa (0.05) dan h0 verwerpen en dan is het model dus bruikbaar
  2. Significantietest regressiecoëfficienten
    kijk naar de beta om te zien welke variabele hoogste unvloed heeft op afhankelijke variabele; hoe dichter bij1 hoe beter
3. Determinatiecoëfficient R2 
hoe meer variatie er verklaard wordt; hoe beter het model lijkt op werkelijke situatie
0.0 = geen voorspelling
1.0 = perfecte voorspelling
kijk naar de adjusted r-sqaured
How well did you know this?
1
Not at all
2
3
4
5
Perfectly