Using Statistics to Test Hypotheses/Significance Flashcards

(37 cards)

1
Q

Hvad er Central Limit Theorem (CLT) og hvad muliggør dette?

A

Det er et statistisk princip, der fortæller os, at hvis vi har en stor nok sample (>30), så vil vi kunne antage at samplingfordelingen har en normalfordeling, selv hvis en sample fra den population ikke har det.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Kan CLT bruges hvis man arbejder med kategoriske eller ordinale data?

A

Nej, CLT kræver at data er numeriske (interval eller ratio) og bruges kun i tests, der baserer sig på gennemsnit og varians. Hvis man arbejder med kategoriske eller ordinale data, bør man vælge non-parametriske tests i stedet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvilke to typer fejl kan man begå ved hypotesetestning? Beskriv dem kort.

A

Type 1 fejl, som er når vi fejlagtigt tror der er en effekt, hvor der ikke er nogen i virkeligheden og type 2 fejl, som er når vi tror, der ikke er nogen effekt, hvor der i virkeligheden er en.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvor stor er sandsynligheden for at lave en type 1 fejl, hvis man bruger et signifikansniveau på 0.05?

A

5%.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad er familywise error rate?

A

Familywise error rate beskriver sandsynligheden for at begå mindst én type 1-fejl, når man laver flere statistiske tests på samme datasæt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvorfor udfører man ikke bare parvise t-tests, når man ønsker at sammenligne 3+ grupper (som med ANOVA)?

A

Fordi parvise t-tests øger risikoen for type 1-fejl (familywise error rate).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad gør man i stedet for at bruge parvise t-tests, når man ønsker at mindske risikoen for familywise error rate i ANOVA tests?

A

Man bruger ofte korrektioner som Bonferroni, når man sammenligner grupper i post-hoc tests.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Statistisk power er sandsynligheden for, at en test finder en effekt, hvis der faktisk er en i populationen (altså: at man ikke begår en type 2-fejl). Hvilke tre faktorer påvirker denne power?

A
  1. Effektstørrelse
  2. Signifikansniveau
  3. Stikprøvestørrelse
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Fortæller signifikans os noget om vigtigheden eller størrelsen af resultatet?

A

Nej - dette er en af problemerne ved nulhypotese testning.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvad er en effektstørrelse?

A

Det er et mål for, hvor stor en effekt eller forskel mellem grupper er i en statistisk analyse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvilke to primære typer af effektstørrelser findes der, og hvilken foretrækkes af forskere?

A

1) Rå effektstørrelse (udtrykt i originale måleenheder)
2) Standardiserede effektstørrelser (foretrækkes af forskere, idet disse kan sammenlignes på tværs af studier - fordi de udtrykkes i standardafvigelser)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvad er tre af de mest brugte effektstørrelser?

A

Cohen’s d, Pearson’s r og Odds Ratio.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvad bruges Cohen’s d til?

A

Til at fortælle os, hvor stor forskellen er mellem to grupper (uanset måleenhed).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvad er cut-offs for hvornår noget er en hhv. lille, medium eller stor effekt jf. Cohen’s d?

A

d = 0.2 (lille)
d = 0.5 (medium)
d = 0.8 (stor)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Nævn de tests hvor man bruger Cohen’s d som effektstørrelse.

A

Independent t-test og dependent t-test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvad bruges Pearson’s r til?

A

Til at måle styrken+retningen af et forhold mellem to kontinuerte variable, eller mellem én kontinuer variabel og en kategorisk variabel, der indebærer to kategorier.

17
Q

Hvilke værdier kan Pearson’s r ligge mellem, og hvad er cut-offs ift. om det er en lille, medium eller stor effekt?

A

Pearson’s r kan variere fra -1 (negativt forhold) gennem 0 (intet forhold) til +1 (positivt forhold).
r = 0.10 (lille)
r = 0.30 (medium)
r = 0.50 (stor)

18
Q

Hvornår bruger man Pearson’s r som effektstørrelse?

A

Bruges i sig selv når man foretager Pearson’s korrelation, såvel som Spearman Correlation.

19
Q

Hvad bruges Odds Ratio til?

A

At sammenligne oddsene for et udfald i én gruppe med oddsene i en anden gruppe.

20
Q

Hvornår bruger man Odds Ratio som effektstørrelse?

A

Når man har kategoriske data (fx ved en Chi-square test)

21
Q

Hvad er cut-offs for hvornår noget er en hhv. lille, medium eller stor effekt ift. Odds Ratio?

A

OR = 1.49 (lille)
OR = 3.45 (medium)
OR = 9.0 (stor)

22
Q

Hvilken effektstørrelse rapporterer man ved Mann-Whitney U og Wilcoxon Signed-rank test?

23
Q

Hvilken effektstørrelse rapporterer man ved Chi-square test, hvis tabellen er større end 2x2?

24
Q

Hvilken effektstørrelse rapporterer man ved lineær regression?

A

R^2 / Adjusted R^2

25
Hvilken effektstørrelse rapporterer man ved ANOVA?
(Partial) Eta squared (n^2) / Omega squared (w^2).
26
Hvilke cut-offs ses ved R^2 ift. lille, medium og stor effekt?
R^2 = .02 (lille) R^2 = .15 (medium) R^2 = .35 (stor)
27
Hvilke cut-offs ses ved (partial) Eta squared (n^2) / Omega squared (w^2) ift. lille, medium og stor effekt?
.01 (lille) .06 (medium) .14 (stor)
28
Hvad er Standard Error (SE)?
SE er standardafvigelsen i en sampling distribution. Den viser, hvor meget et stikprøvegennemsnit typisk afviger fra det sande populationsgennemsnit. Jo mindre SE, jo mere præcis stikprøven.
29
Hvad betyder sampling variation?
Det er den naturlige variation, der opstår, når man tager flere stikprøver fra samme population – deres gennemsnit vil sjældent være identiske.
30
Hvad er en sampling distribution?
En teoretisk fordeling af stikprøvegennemsnit, man ville få, hvis man gentog sin stikprøve mange gange. SE er standardafvigelsen af denne.
31
Hvad er et konfidensinterval (CI)?
Et interval omkring en stikprøveværdi, der med fx 95 % sandsynlighed indeholder den sande populationsværdi.
32
hvad er forskellen på direktionel og nondirektionel hypotese?
Direktionel: forudser retning på effekten (fx "mere → bedre"). Nondirektionel: forudser blot en forskel, men ikke retningen.
33
Hvad er forskellen på en one-tailed og two-tailed test?
One-tailed tester effekt i én retning. Two-tailed tester begge retninger. Two-tailed er standard, da det fanger effekter i begge retninger.
34
Hvad står MSE for, og hvad måler det?
Mean Squared Error – et mål for hvor godt en model passer til data. Lav MSE = god model fit.
35
Hvad er forskellen på standard deviation og standard error?
SD viser variation i én sample. SE viser variation mellem stikprøvegennemsnit i en hel sampling distribution.
36
Hvornår er det problematisk at bruge en one-tailed test?
Når effekten viser sig i den modsatte retning – så vil man slet ikke opdage den. Det kan føre til fejlagtige konklusioner.
37