Les 2 - Regressie analyse Flashcards

(17 cards)

1
Q

doel van een regressie - analyse

A

Voorspellen of verklaren van een afhankelijke variabele (AV -> verklaarde variabele want geen causaliteit) op basis van één (of meerdere) onafhankelijke variabelen (OV  verklarende variabelen) op basis van een lineair model

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

ŷ

A

= afhankelijke variabele

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

x

A

onafhankelijke var

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

b1

A

regressiecoëfficiënt = slope

= de gemiddelde toe/afname van de afhankelijke variabele
wanneer de onafhankelijke variabele 1 eenheid stijgt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

b0

A

= constante = intercept
= de waarde van de afhankelijke variabele wanneer de onafhankelijke variabele = 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

enkelvoudige regressie - idee

A

Voor elke vaste waarde van x varieert y normaal rond y met standaardafwijking 

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

meervoudige regressie - idee

A

voor elke specifieke verzameling van waarden van x=(x1 x2 … xp) varieert y normaal rond y met standaardafwijking 

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

waarde van determinatiecoëfficiënt

A

Indien die hoog is dan zal (1- R21) klein worden en de variantie in de schatter stijgen, waardoor de precisie ervan daalt!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

interpretatie R^2

A

R² is de fractie van de variantie in de verklaarde variabele y die wordt verklaard door de verklarende variabelen x1, x2, …, xp

of

R² is de proportionele reductie van de fout bij de voorspelling van y ahv de regressievergelijking tov de fout gemaakt zonder kennis van de regressievergelijking

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

nadelen R^2

A
  1. Overschat bij kleine N (bvb. 2 waarnemingen; R2 =1)
  2. R2 stijgt bij toenemend aantal OV, zelfs bij toevoeging irrelevante OV
  3. Steekproefspecifiek
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

adjusted R^2

A
  • voor modelvergelijking (modellen met verschillende aantallen p en n)
  • kan dalen als p stijgt, interpretatie idem
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Om na te gaan of meervoudige regressiemodel geschikt is voor de data:

A
  • Residuen uitzetten tegenover voorspelde waarden
  • Residuen ook uitzetten tegenover elke verklaarde variabele
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Tolerantie

A

proportie variantie van een OV die NIET kan verklaard worden door de andere OV  zo groot mogelijk (min = 0.5)!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Logistische regressie

A

AV (verklaarde variabele) is categorisch  eindig aantal categorieën (nominaal/ordinaal)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

logistische regressie - binair

A

verklaarde variabele is dichotoom (e.g., ja/nee, man/vrouw, geslaagd/niet geslaagd)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

logistische regressie - multinominaal

A

verklaarde variabele heeft meer dan 2 niveaus (e.g., soort behandeling, studierichting, opleidingsniveau)

17
Q

Interpretatie odds

A
  • de kansverhouding (of odds) dat een bejaarde in deze groep lijdt aan dementie bedraagt ongeveer 1 tegen 3
  • de kansverhouding (odds) dat een bejaarde in deze groep NIET lijdt aan dementie bedraagt ongeveer 3 tegen 1