4 - Analysis of qualitative data and non-parametric methods Flashcards

(12 cards)

1
Q

Hvad indebærer repræsentation, beskrivelse og analyse af kvalitative variable?

A

Det handler om at organisere (fx i frekvenstabeller), opsummere (fx med andele/procenter, modalværdi) og analysere data, der beskriver kategorier eller egenskaber (fx køn, farve, holdning), snarere end numeriske mængder.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad er proportioner (andele) og inferens om proportioner?

A

Proportion: Den brøkdel eller procentdel af en stikprøve eller population, der falder i en bestemt kategori (fx andelen af vælgere, der støtter et parti).

Inferens om proportioner: At bruge stikprøvedata til at drage konklusioner om populationsproportioner, fx ved at lave konfidensintervaller eller hypotesetests for en proportion eller forskellen mellem to proportioner.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvordan undersøges sammenhængen mellem kvalitative variable?

A

Ofte ved hjælp af krydstabeller (kontingenstabeller), der viser frekvenserne for kombinationer af kategorier fra to (eller flere) variable. Man kan derefter beregne betingede proportioner og anvende tests som chi-square testen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvad bruges Chi-square (χ²) testen for association (uafhængighed) til?

A

Til at teste, om der er en statistisk signifikant sammenhæng (association) mellem to kvalitative (kategoriske) variable i en population, baseret på data i en krydstabel. Nulhypotesen er typisk, at variablene er uafhængige.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad er Relativ Risiko (RR), og hvad bruges inferens om det til?

A

Relativ Risiko (RR): Et mål for, hvor mange gange højere risikoen for en bestemt hændelse (fx sygdom) er i én gruppe (fx eksponerede) sammenlignet med en anden gruppe (fx ikke-eksponerede). Beregnes som (andel med hændelse i gruppe 1) / (andel med hændelse i gruppe 2).

Inferens om RR: At estimere et konfidensinterval for den sande relative risiko i populationen eller teste hypoteser om den (fx om RR er signifikant forskellig fra 1).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad kendetegner non-parametriske statistiske metoder?

A

Metoder, der ikke kræver stærke antagelser om fordelingen af de data, de analyserer (især ikke antagelsen om normalfordeling). De er ofte baseret på rangordning af data og kan bruges til både kvantitative og kvalitative (ordinale) data. Kaldes også fordelingsfrie metoder.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad bruges ‘The Sign Test’ (Fortegnstesten) til?

A

En simpel non-parametrisk test til at undersøge, om der er en forskel i medianen mellem parrede observationer (fx før/efter målinger) eller til at teste en hypotese om medianen i en enkelt population. Den ser kun på fortegnet (+ eller -) af forskellene.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvad bruges Wilcoxon Signed-Rank Test til?

A

En non-parametrisk test til at sammenligne to relaterede stikprøver (parrede data) eller til at teste en hypotese om medianen af en symmetrisk fordeling. Den tager både fortegnet og størrelsen (rangen) af forskellene i betragtning, hvilket gør den mere kraftfuld end fortegnstesten, når data tillader det.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvad bruges Wilcoxon Rank-Sum Test (også kendt som Mann-Whitney U Test) til?

A

En non-parametrisk test til at sammenligne medianerne (eller mere generelt fordelingerne) af to uafhængige grupper. Den rangerer alle observationer fra begge grupper samlet og sammenligner rangsummerne for de to grupper. Det er det non-parametriske alternativ til en uafhængig t-test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvad bruges Kruskal-Wallis Test til?

A

En non-parametrisk test til at sammenligne medianerne (eller fordelingerne) af to eller flere uafhængige grupper. Det er det non-parametriske alternativ til en one-way ANOVA.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Nævn nogle fordele og ulemper ved non-parametriske metoder.

A

Fordele: Kræver færre antagelser (især om normalfordeling), robuste over for outliers, kan bruges på ordinale data og små stikprøver.

Ulemper: Kan være mindre statistisk kraftfulde (hvis antagelserne for parametriske tests er opfyldt), giver måske mindre detaljeret information (fx tester medianer frem for middelværdier), kan være mere beregningskrævende manuelt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvad er Bootstrapping?

A

En computer-intensiv resampling-metode, hvor man gentagne gange udtager stikprøver med tilbagelægning fra den oprindelige stikprøve for at estimere sampling-fordelingen af en statistik. Bruges til at lave konfidensintervaller og hypotesetests, især når teoretiske metoder er svære eller baseret på tvivlsomme antagelser.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly