Uge 12 - Regression Flashcards

(20 cards)

1
Q

Hvornår bruges regressionsanalysen

A

Regression bruges når man ønsker at undersøge om man kan forudse/predict værdien af en variabel (outcome/DV) baseret på værdien af en anden variabel (predictor/IV).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvordan adskilles correlation og reggressions analyser sig?

A

Correlation: Skelner ikke mellem predictor og outcom variabel. Her ser man blot på om der er en relation mellem to variabler.

Regression: Man skelnes der mellem predictor og outcome variabel. Her kan man også antager retning (directionality) altså, at værdien af outcome forudsiges af værdien af ​​prædiktoren
Regression kan dog ikke antage kausalitet da man mangler eksperimentel manipulation/kontrol

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad er de 5 assumptions for Lineær regression?

A

En lineær regression kan bruges til at lave prædiktive modeller hvis dataen opfylder disse 5 assumptions og har :

  1. Lineære sammenhænge (repræsenteret ved lige linjer)
  2. To kontinuerte variabler
  3. Normalfordelt (errors)
  4. Uafhængige observationer (independent) (error)
  5. Homoskedasticitet (lige store residualvarians på alle niveauer af prædiktor variablen.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvad betyder bivariant analyse?

A

En analyse af 2 variabler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad beskriver best fit linjen/ regressionslinjen i en regressionsanalyse?

A

Best fit-linjen i lineær regressionsanalyse er den rette linje, der bedst beskriver sammenhængen mellem to variabler. Den beregnes, så afstanden mellem linjen og datapunkterne er så lille som muligt. Linjen bruges til at forudsige værdier og vise, om der er en positiv eller negativ sammenhæng.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad er residualer ift regressionslinjen i en regressionsanalyse?

A

Residualer er afstanden fra en observationen til regressionslinjen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad betyder de forskellige dele i en regressions formel:

y=b0+b1x+e

A

y= outcome/ afhængig variabel

b0= y når x er 0

b1= hældningskoefficienten (ændringen i y når x stiger med 1)

x= den uafhængige/ prædiktorer variabel (det du bruger til at forudsige)

e= error (forskellen mellem den forudsagte og den faktiske værdi af 𝑦)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvad fortæller R^2 os i en regressionsanalyse

A

R2 (i 2.) = fortæller, hvor godt modellen passer til vores data — altså hvor meget af variationen i y, der kan forklares af x. i procent (1 = 100%). I regressionsanalyse er det, hvor meget bedre regressionsmodellen er end mean modellen (eller bare mean) til at forudsige y (outcome).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvad betyder SSt (Total Sum of Squares) i regressionsanalysen:

A

Den samlede variation i dataene – altså variationen mellem de observerede outcome (fx. eksamenskarakterer) og det mest simple model (Mean model) (fx mean af eksamenskaraktererne).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvad betyder SSR (Residual Sum of Squares i regressionsanalysen:

A

Residual/Error variationen - variation mellem det, som regressionsmodellen finder (fx den forudsagte eksamenskarakter), og det, der faktisk blev observeret (fx. den faktiske karakter).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvad betyder SSM (Model Sum of Squares) i regressionsanalysen:

A

Modelens variationen – altså forskellen i variation mellem: regressionsmodellen (fx. forudsagte karakter ud fra bedst-fit-linjen), og mean (fx forudsagt karaktere baseret på den samlet mean).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvad er df for MS_model i regressionsanalysen.

A

df for modellen er typisk antallet af prædiktorer – fx 1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvad er df for MS_Residual i regressionsanalysen.

A

df = antal observationer (minus) antal prædiktorer og 1 for konstanten,
dvs. N – 2

(hvis der havde været 2 prædiktorer havde det været 3)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvad er Mean Squares (MS), og hvordan bruges det i regressionsanalyse?

A

MS = Sums of Squares (SS) delt med degrees of freedom (df), altså gennemsnitlig variation pr. frihedsgrad.

MS bruges i regressionsanalyse til at sammenligne forklaret og uforklaret variation.

Det indgår i F-testen, som vurderer, om modellen samlet set er signifikant.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvad er MS_Model og MS_Residual i regression, og hvordan beregnes de?

A

MS_Model: hvor meget modellen bidrager til at forklare variationen i y. (effect).
MS_model= Sum of squars_Model delt med df_Model (typisk antal prædiktorer).

MS_Residual: det, modellen ikke kan forklare; støj eller tilfældigheder (Error).
MS_R= Sum of squares _Residual delt med df_Residual (N minus antal prædiktorer minus 1).

MS bruges til at vurdere, hvor godt modellen passer data. Jo større MS_M er ift. MS_R jo bedre er reggressions modellen til at forudsige outcomet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvad er F i regressionsanalyse, og hvad viser det?

A

F tester, om regressionsmodellen samlet set forklarer y bedre end mean modellen. det gør den ved at sammenligne forbedring/ effect (MS_Model) med fejl (MS_Residual).

F beregnes som:
MS_Model / MS_Residual.

Hvis F > 1, er modellen bedre end tilfældigheder, men den skal også være signifikant (p-værdi).

17
Q

Hvad betyder et signifikant F i reggressions analysen?

A

Hvis F-værdien er højere end den kritiske værdi, kan vi sige, at modellen passer signifikant bedre end tilfældigheder. og vi forkaster nul hypotesen.

18
Q

Hvad tester t-statistikken i en regressionsanalyse?

A

T-statistic = Tester, om en enkelt prædiktor (b1) har en statistisk signifikant effekt på y.

Den sammenligner b1 med b1 i nul hypotesen (b1=0 (b- expected) ved at trække b1-observeret fra b1-expected og dividere med standard error for b1.

19
Q

Hvilke ting skal rapporteres når man har lavet en regressions analyse?

A

Brug alle oplysninger du har:
Overall fit af modellen (R^2 og F-ratio)
Betydningen/signifikans af ​​individuelle prædiktorer (b-værdi og t-statistik)
p-værdier <_ .05 (sig. i SPSS)
Et signifikant resultat i en simpel lineær regression med kun 1 prædiktor betyder at vi kan konkludere, at x er en signifikant prædiktor for y
kan alt sammen udledes i SPSS (kig evt. på uge 12 vores slides p. 36)

20
Q

Foklar kort forskellen på a bivariate linear regression analyse og correlations analyse.

A

Correlation: er en symmetrisk måling der ikke skelner mellem predictor og outcom variabel. Her ser man blot på om der er en relation mellem to variabler.

Regression: Man skelnes der mellem predictor og outcome variabel. Her kan man også antager retning (directionality) som indebærer, at værdien af outcome forudsiges af værdien af ​​prædiktoren