Simple Linear Regression Flashcards

(33 cards)

1
Q

Hvorfor (og hvordan) undersøger man overall model fit?

A

Fordi man sjældent finder en perfekt lineær sammenhæng, ser man i stedet hvor godt modellen passer - ved at kigge på fejlene i forudsigelserne - kaldet residuals.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad kaldes forskellen mellem den observerede værdi og den værdi, modellen forudsiger?

A

Residual (fejl).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad viser residuals?

A

Hvor meget data afviger fra den perfekte (forudsagte) linje.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvad er ‘Least Squares Fit’?

A

Den bedst passende linje, der minimerer summen af kvadrerede afvigelser (residuals).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad står SSr for i regression?

A

Residual Sum of Squares.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad repræsenterer SSr?

A

Summen af forskellene mellem de observerede værdier og modellens forudsigelser.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad står SSt for?

A

Total Sum of Squares.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvad repræsenterer SSt?

A

Summen af forskellene mellem de observerede værdier og gennemsnittet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvad står SSm for?

A

Model Sum of Squares.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvad viser SSm?

A

Forskellen mellem modellens forudsigelser og gennemsnittets. Er derfor et udtryk for, hvor meget bedre regressionsmodellen er til at forudsige ift. hvis man blot brugte gennemsnittet som model.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvad angiver R² (forklaringsgraden)?

A

Hvor stor en andel af variationen i den afhængige variabel, der kan forklares af modellen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvad betyder R² = 0,65?

A

At modellen forklarer 65 % af variationen i data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvad bruges F-testen i lineær regression til?

A

At vurdere, om hele regressionsmodellen er signifikant bedre til at forklare variationen i data end en model uden prædiktorer (fx gennemsnittet).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvordan beregnes F-testen?

A

Ved at man kigger på forholdet mellem forbedringen fra modellen SSm og den resterende fejl SSr.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvad er ‘Mean Squares’ i regression?

A

Gennemsnitlig varians beregnet for at sammenligne SSm og SSr.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvordan beregnes MSm (Mean Square for Model)?

A

MSm = SSM / 1.

17
Q

Hvordan beregnes MSr (Mean Square for Residuals)?

A

MSr = SSR / N-2.

18
Q

Hvordan beregnes F-værdien?

A

F = MSm / MSr.

19
Q

Hvad indikerer en høj F-værdi?

A

At den systematiske varians er stor i forhold til den usystematiske varians - modellen forklarer derfor noget, der er statistisk signifikant.

20
Q

Hvordan vurderes signifikans af F-værdien?

A

Ved at sammenligne den med en kritisk F-værdi i F-distributionen baseret på de relevante frihedsgrader (N-2).

21
Q

Hvad er de nødvendige antagelser for simpel lineær regression?

A

1) Lineært forhold
2) To kontinuere variable
3) Normalfordeling af fejl
4) Uafhængige observationer af fejl
5) Homoskedasticitet

Homoskedasticitet betyder, at variansen af residualerne er ensartet på tværs af alle værdier af prædiktoren.

22
Q

Hvad er de to overordnede trin i analysen af simpel lineær regression?

A

1) Vurdering af overall model fit (R^2 og F)

2) Vurdering af de individuelle prædiktorer (b og t-statisik)

R^2 angiver, hvor godt modellen passer til dataene, mens F-testen vurderer, om modellen som helhed er signifikant.

23
Q

Hvilke konkrete steps skal man følge for at udføre en simpel lineær regression?

A

1) Indsæt data og tilpas regressionslinje
2) Find overall fit via R^2 og f-ratio
3) Test signifikans for f-ratio
4) Find signifikans af individuel predictor (b)
5) Fortolk resultater i henhold til nulhypotesen
6) Rapportér i APA-format
7) Brug modellen til forudsigelser

APA-format refererer til American Psychological Association’s stilguide for rapportering af forskning.

24
Q

Hvad tester man med en t-statistik i simpel lineær regression?

A

Signifikansen af de individuelle prædiktorer. Altså om b1 er signifikant anderledes fra 0.

Nulhypotesen er, at b = 0, hvilket betyder, at der ikke er nogen sammenhæng mellem prædiktor og udfald.

25
Hvad betyder det, hvis p-værdien er <.05 i t-statisk i simple linær regression?
b er signifikant forskellig fra 0, hvilket indikerer, at prædiktoren har en signifikant effekt på outcome variablen ## Footnote Dette betyder, at der er en statistisk signifikant sammenhæng mellem prædiktoren og udfaldsvariablen.
26
Hvad er frihedsgraderne for t-distributionen, hvis der kun er én prædiktor?
N - 2 ## Footnote N refererer til antallet af observationer i datasættet.
27
Hvad er korrelation?
Et symmetrisk mål, der beskriver sammenhængen mellem to variable - uden at skelne mellem prædiktor- og udfaldsvariabel. ## Footnote Korrelation beskriver blot styrken og retningen af en sammenhæng mellem to variabler.
28
Hvad beskriver korrelation?
Styrken og retningen af en sammenhæng mellem to variabler. ## Footnote Korrelation skelner ikke mellem hvilke variabler der er prædiktorer eller udfald.
29
Hvordan adskiller regression sig fra korrelation?
Regression er et mål, hvor der skelnes mellem prædiktor (uafhængig variabel) og udfaldsvariabel (afhængig variabel) - dette ses ikke i korrelation. ## Footnote Regression antager en retning i forhold til variablerne.
30
Hvad antager regression?
Regression antager retning – værdien af udfaldsvariablen forudsiges ud fra værdien af prædiktorvariablen. ## Footnote Dette indebærer en forudsigelse baseret på uafhængige og afhængige variabler.
31
Kan man antage årsagssammenhæng ved regression?
Nej, medmindre der er eksperimentel manipulation eller kontrol, kan man ikke drage nogen kausal sammenhæng. ## Footnote Dette betyder, at uden eksperimentel kontrol kan man ikke konkludere, at en variabel forårsager ændringer i en anden.
32
Hvad er nulhypotesen ved t-statisk i linær regression?
Nulhypotesen er, at b = 0, hvilket betyder, at der ikke er nogen sammenhæng mellem prædiktor og udfald. Hvis p< .05 så er b signifkant anderledes.
33
Hvad rapporteres typisk ved lineær regression?
Altid rapporter hvad der blev observeret, før man går videre til signifikans: 1. b-koefficientens værdi. 2. t værdi (frihedsgrader) 3. Signifikans 4. Varians (R^2) 5. Model fit (F-statistik og signifikans)