Deskriptiv statistik Flashcards

1
Q

Hvad er standardafvigelse og hvordan beregnes den?

A

Standardafvigelse også kaldt spredningen, fortæller noget om hvor stor spredning der er datasættet, dvs. hvor stor afvigelse der er fra middelværdien/gennemsnitten.

Den beregnes som kvadratroden af variansen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvordan hænger P-værdi og signifikansniveauet sammen?

A

Kort sagt: metode til at afgøre, om man skal forkaste nulhypotesen eller ej.

P-værdien er den værdi, der fortæller en, om en sammenhæng er statistisk signifikant.

Signifikansniveauet, a, er sandsynligheden for at forkaste nulhypotesen H0, hvor man ikke skulle have gjort det, dvs. en type I-fejl. Typisk vælger man et signifikansniveau på 5%, dvs. man accepterer en type I-fejl på 5%.
- Jo lavere signifikansniveau, jo sværere er det at forkaste nulhypotesen.

Regel:
- Forkaster H0, hvis p-værdien er mindre end signifikansniveauet (typisk 5%).
- Forkaster ikke H0, hvis p-værdien er større end signifikansniveauet (typisk 5%)

Det normale område man vælger ligger mellem alfa 1-10% (eller fra 0,01 til 0,10)
Valg af Alfa kan være afgørende for, om vi skal forkaste h0 eller ej

Hvis en p-værdi ligger under 0,01 vil man altid forkaste H0, dvs. valg af alfa er ikke kritisk-

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad er en varians og hvordan beregnes den?

A

Varians fortæller noget om hvor stor spredning der er datasættet, dvs. hvor stor afvigelse der er fra middelværdien/gennemsnitten.

Den beregnes som:

VAR(X)= hyppighed*(x1-middelværdi)^2 + …. indtil man har alt med. Derefter dividerer man med det samlede antal observationer, N. Dvs.

VAR(X) = h1*(x1-middelværdi)^2 / antal N.

Variansen er også standardafvigelsen^2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvad er en outlier og hvad har den af betydning for hhv. gennemsnit og spredningsmålene? Hvad er fordelen ved at udeladelse af outliers?

A

Det er ekstreme værdier, som ligger afviger meget fra øvrige dataværdier i datasættet.

Såfremt man har ekstreme værdier i sit datasæt, kan det påvirke gennemsnittet, idet gennemsnittet bliver enten meget højere eller lavere.

Ved udladelse af outliers, kan man mindste risikoen for usikkerheder, og øge forklaringsgraden i modeller.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad er missing values og hvad har den af betydning for hhv. gennemsnit og spredningsmålene?

A

Er manglende gyldige dataværdier. Dvs. hvis respondenten ikke har svaret på spørgsmålet. Typisk “Ved ikke” svarmuligheder.

Ved mange missing values, kan det påvirke generaliserbarheden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad er deskriptiv statistik?

A

Deskriptiv statistik er en samling af metoder, der beskriver og opsummerer det data, man har indsamlet. Deskriptiv statistik beskriver kun den indsamlede data og generaliserer ikke på baggrund af data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvis man forkaster en nulhypotese, hvad betyder det så?

A

Forkast nulhypotese
Man har en stærk konklusion (man er hård). Man tror på alternativ hypotesen.
Grunden til man har en stærk konklusion, er fordi man har kunne påvise noget; nemlig at der er forskel mellem populationerne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvis man forkaster en H alternativ, hvad betyder det så?

A

Man har en svag konklusion (man er blød), for det betyder ikke at den er 100% sand, eftersom man måske vil få andre resultater ved nærmere undersøgelser, da man kun har taget 1 stikprøve ud af en stor population. Man tror på nulhypotesen med et lighedstegn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly