1 An introduction to analysis of variance Flashcards

1
Q

Hva er Model formulae? Gi et eksempel.

A

Model formulae formler som bruker ord i stedet for tall. Eksempel WEIGHT=SEX om kjønnet predikerer vekten.
* Data variable variabelen som står til venstre som vi ønsker å forklare
* Explanatory variable variabelen som står til høyre som vi tror har en påvirkning på data variable
Det kan være flere forklaringsvariabler, for eksempel alt annet som påvirker vekten som ikke er kjønn (spisevaner, genetikk osv). Dette kommer i kategorien error og oppdatert formel blir WEIGHT = SEX + ERRO

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hva er GLM?

A

General Linear Models (GLM) en teknikk som bruker model formulae og geometrical analogies til å unngå matematiske detaljer. Regression og ANOVA er innunder GLM.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hva er ANOVA?

A

ANOVA analysis of variance. Tester om variance er større mellom behandlingsgrupper enn innad i behandlingsgrupper.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hva brukes ANOVA til?

A

Sammenligne flere grupper ved hjelp av variasjonen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvordan regnes variasjonen ut?

A

Regne ut variasjon:
1. Finn mean
2. Finn deviations som er avstanden fra mean for hvert punkt (summen av disse avstandene blir 0)
3. Square og summer deviations for å få Sum of squares (SS)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hva er variance?

A

Variance (s2 i sample, σ2 i populasjonen) måler variability og tar hensyn til størrelsen på datasettet.
is the expectation of the squared deviation of a random variable from its population mean or sample mean. Variance is a measure of dispersion, meaning it is a measure of how far a set of numbers is spread out from their average value.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hva betyr signifikant?

A

Significant når er variability mellom gruppene stor nok til at det ikke er tilfeldig.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hva er grand mean?

A

Grand mean det regnes ut et felles mean fra alle grupper. (Eks på grupper: behandlet med ab mot inf i bevegelsessystemet, behandlet med ab mot inf i andre deler av kroppen, ubehandlet og så kan man regne ut felles mean av alle lesjonsstørrelse)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvordan undersøkes variabiliteten i ANOVA?

A

1a Finn felles mean for grupper
1b Regn ut sum of squares
§ Se på variasjonen: legger en gruppe seg konsekvent over/under “grand mean/felles mean”?
2a Regn ut mean for hver gruppe
§ Ligger mean for hver gruppe ganske tett og det fortsatt er stor spredning, så forklarer ikke faktoren man undersøker variasjonen
2b Finn sum of squares innad i hver gruppe
Er plottene like langt fra mean nå når mean er spesialtilpasset gruppene?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hva er SSY, SSE og SSF?

A

SSY=total sum of squares : deviation fra grand mean, altså totale variasjonen i datasettet (flest kvadrater)
SSE=error sum of squares: all deviation som ikke ligger på hver enkelt gruppe sin mean (varierende antall kvadrater, kan i teorien være 0)
SSF=fertilizer sum of squares (forklaringsvariabelen, kan forkortes annerledes): hvordan gruppemeans avviker fra grand mean (få kvadrater)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvordan er forholdet mellom SSY, SSE og SSF?

A

SSY=SSE+SSF

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hva er degrees of freedom?

A

Df er antallet uavhengige informasjonskilder som bidrar til statistikken.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvor mange df bør det minst være i error?

A

Det bør være minst 10-20 df i error.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hva skjer om man har for få df?

A

Hvis det ikke er noen df, så er parameteren udefinert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hva er MS?

A

Mean square (MS) measure of variability per degrees of freedom. I motsetning til SS er denne ikke addidativ.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvordan regnes MS

A

MS=SS/df
Det kan gjøres for alle variablene sine SS:
TMS (total mean square) = SSY/ df for SSY
EMS (error mean square) = SSE/ df for SSE
FMS (fra bokeksempel, angår variabelen) = SSF/ df for variabelen

17
Q

Hva er F-ratio?

A

F-ratio=MS(treatment)/MS(error)
Nullhypotesen er at alle gruppene er like.
○ F-ratio=1 dersom nullhypotesen stemmer.
§ Treffer sjelden nøyaktig 1 grunnet tilfeldig variasjon i utvalget.
F-ratio > 1 dersom det er forskjell mellom gruppene

18
Q

Hvorfor signifikanstestes F-ratioen?

A

Når en F-ratio er regnet ut, så signifikanstestes (p-verdi) den (vanlig å bruke 5%) for at man med ganske stor sikkerhet (95%) kan si at det ikke var tilfeldig at F-ratioen var over 1. P-verdien regner programmet ut eller man kan slå det opp i tabeller utifra F-ratio.

19
Q

Hvordan bør resultater fra ANOVA presenteres?

A

Means for hver gruppe og confidence intervals for hver gruppe
Resultatpresentasjon: Mean+/-tcrit*SEmean