Fundament for statistik Flashcards

Fundament for statistik, beskrivende statistik, fejltyper og terminologi

1
Q

Hvad er population (befolkning) og stikprøve?

A

Populationen er den gruppe, man er interesseret i at undersøge (f.eks. Danskere)

Indenfor statistik er en stikprøve (eller sample) en delmængde af en population. Stikprøven er en randomiseret udvælgelse derfra (en delmængde af befolkningen).

Baseret på stikprøven, kan man lave inferens. Man skal derfor være obs på, om stikprøven er repræsentativ for befolkningen.

N = stikprøvens størrelse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad er intern validitet?

A

Spørgeskemaet måler, hvad du har til hensigt at måle.

Bruger typisk litteratur og andres forskning.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad er ekstern validitet?

A

Forskningsresultater kan overføres til en større befolkning og generel kontekst.

Man skal tjekke, om det er overførbart ift. konteksten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvad er reliabilitet?

A

Pålidelighed

Spørgeskemaet giver konsistente resultater under forskellige omstændigheder

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad er norminal måleniveau?

A

Kategorierne på variable er gensidigt udelukkende.

Ikke muligt rangordne eller sige noget om afstand mellem dem.

(f.eks. køn).

Kategorisk

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad er ordinal måleniveau?

A

Kategorierne på variable er gensidigt udelukkende.

Muligt rangordne.

Typisk kategorisk –> men ved en likert-skala kan det bruges som kontinuerligt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad er interval måleniveau?

A

Kategorierne på variable er gensidigt udelukkende.

Muligt rangordne.

Muligt at fortolke afstande.

Ligeligt delt skala, men intet absolut nulpunkt.

(fx eksisterer ”ingen” temperatur).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvad er ratio/forhold måleniveau?

A

Kategorierne på variable er gensidigt udelukkende.

Muligt rangordne.

Meningsfuld at fortolke forholdet mellem to enheder.

Et absolut nulpunkt.

(fx alder – en person har dobbelt så høj alder, som en anden).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvorfor kan man ikke sætte kategoriske variabler ind i noget, hvor der regnes gennemsnit?

A

Det kan man ikke, fordi de gensidigt udelukker hinanden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvad skal man være særlig opmærksom på ved spørgeskemaer?

A

Ved spørgeskemaer kan udefrakommende faktorer påvirke den afhængige variabel og dermed være den faktiske årsag.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvad er skew?

A

Hvordan fordelingen er ift. gennemsnittet.

Er der tendens til at dataen er meget til venstre (positiv) for gennemsnittet, eller meget til højre (negativ) for gennemsnittet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvad er kurtosis?

A

Handler om tykkelsen (koncentrationen) af halerne og/eller midten af fordelingen.

Hvor bred (negativ - stor grad af variation) eller snæver (positiv - lille grad af variation) er normalfordelingen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvad ville en stærk positiv kurtosis betyde?

A

Det kan betyde, at der er en øget koncentration af data omkring den centrale tendens (for eksempel gennemsnittet), og samtidig kan der være flere ekstreme observationer (outliers) i datasættet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvordan ser man de centrale tendenser?

A

Middelværdi (the mean) = Summen af værdierne divideret med antallet af værdier inkluderet i summen.

Medianen (the median) = Det talmæssige midtpunkt i dataene.

Typetallet (the mode) = Der er den værdi, der forekommer oftest i dataene.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvad er de forskellige måder at forklare varians?

A

Deviation (varians/afvigelse): Angiver forskellen mellem en enkelt observation og gennemsnittet af datasættet.

Range (spredning): Forskellen mellem den største og mindste værdi i en datasæt.

Standard Deviation (standardafvigelse): Det angiver, hvor meget de gennemsnitlige afvigelser typisk afviger fra gennemsnittet. (Jo højere standardafvigelsen er, desto større varians i dataen.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvad er interkvartilområdet?

A

Der hvor 50 pct. af ens data

17
Q

Hvilke fejltyper er der?

A

Type 1 fejl: Falsk positiv (til en mand –> du er gravid)

Type 2 fejl: Falsk negativ (til en gravid kvinde –> du er ikke gravid)

18
Q

Hvad er den afhængige variabel?

A

Den variabel, man ønsker at måle (det centrale i ens opgave) (fx indkomst)

19
Q

Hvad er den uafhængige variabel?

A

Det man tror, der påvirker den afhængige variabel.

Den bruges til at forklare en ændring i den afhængige (fx uddannelsesniveau)

20
Q

Hvad er medierende variabel?

A

Det der transmitterer effekten mellem afhængig og uafhængig variabel (fx færdigheder)

21
Q

Hvad er modererende variabel?

A

Det der påvirker styrken mellem den uafhængige og afhængige variabel (f.eks. biologiske køn).

22
Q

Hvad er en hypotese?

A

En hypotese er en testbar erklæring om forholdet mellem to eller flere variabler eller en foreslået forklaring på et observeret fænomen.

23
Q

Hvis spørgsmålet er: Er der en association mellem uddannelsesniveau og indkomst?

Hvad er så nul hypotesen?

A

Der er ingen association mellem
uddannelsesniveau og indkomst.

24
Q

Hvis spørgsmålet er: Er der en association mellem uddannelsesniveau og indkomst?

Hvad er så den alternative hypotese?

A

Der er en association mellem
uddannelsesniveau og indkomst.

25
Q

Hvorfor opstiller vi nulhypoteser?

A

Formålet med at opstille en nulhypotese er at teste og evaluere, om der er signifikante forskelle eller sammenhænge i data.

26
Q

Hvad er omstændigheder i statistik?

A

Handler om, hvorvidt det er kategorisk eller kontinuerlig data

27
Q

Hvad er kategorisk data?

A

Når variablerne er gensidigt udelukkende

28
Q

Hvad er kontinuerlige data?

A

Når variablerne kan rangordnes

29
Q

Hvad er forskellen på beskrivende og inferentiel statistik?

A

Ved beskrivende statisk opsummere man bare den data man har (f.eks. Middelværdi og standardafvigelser)

Inferentiel statistik er, når man søger at udlede resultater til hele populationer. Det er altså når man reelt tester sine hypoteser.