Deskriptiv statistikk Flashcards
(11 cards)
Nevn fire ulike målenivå på variabler
- Nominal (= kun merkelapp, sier ikke noe om menge egenskap. Eks: Kvinne / mann, eller kontrollgruppe / eksperimentgruppe)
- Ordinal (= rangering av egenskap, men ikke en bestemt avstand mellom tallverdier. Eks: Ikke plaget (1), litt plaget (2), ganske mye plaget (3), svært plaget (4))
- Intervall (= fast avstand mellom tallverdier, ikke absolutt nullpunkt. Eks: Iq)
- Ratio/forholdstall (= fast avstand mellom tallverdier OG absolutt nullpunkt. Eks: Vekt, alder antall ganger man utfører en atferd)
De to siste, intervall og ratio, er kontinuerlige variabler, og dermed også best egner til statistiske analyser
Hva er varians, og hvordan finner man varians?
Man beregner avvik fra gjennomsnittsverdier i gruppa
Avvikene kvadreres før de summeres, fordi at hvis de ikke kvadreres, vil summen av avvikene bli null
Summen av de kvadrerte avvikene deles på n-1 (n-1 er det samme som antall frihetsgrader. Å bruke dette gir er mer presist estimat. Årsak: vi overdriver ofte variansen i små utvalg, så vi trekker fra én for å korrigere)
På psykologiske tester er testleddet ofte målt på…
…ordinalnivå. Men summen eller gjennomsnittet av testleddene betraktes ofte som en kontinuerlig variabel
Nevn tre mål på sentraltendens
- Gjennomsnitt (mean)
- Median - alle verdier rangeres, finn midtverdi
- Modal - hyppigste verdi
Hva er normalfordeling?
En symmetrisk fordeling der de fleste skårer rundt gjennomsnittet.
Mange variabler forventes å være tilnærmet normalfordelt i befolkningen, som høyde og vekt, skåre på iq-test, skår på personlighetstrekk m.m.
Ved perfekt normalfordeling er gjennomsnitt, median og modal like
Hva er en bimodal fordeling?
En fordeling med to «topper».
Eksempel på forelesning: antall alkoholenheter i løpet av en måned. Én topp for studenter som ikke drikker, en annen fordeling blant de som drikker.
Variasjonsbredde
= fra høyeste til laveste verdi
Kan være sensitiv for outliers
Interkvartil range
Rangerer de nederste 25 % og de øverste 25 %
Hva er standardavvik, og hvordan finner man det?
Standardavvik er et mål på spredning, og et slags speilbilde av variansen.
Når vi vet varians, kan vi beregne standardavvik - et gjennomsnittlig avvik fra snittet.
Standardavvik = kvadratroten av variansen.
Standardavvik er vanlig å oppgi, fordi:
Hvis vi har en tilnærmet normalfordeling av skårer, vil alltid et bestemt prosentandel skåre mellom snitt og ett standardavvik over/under.
Burde hatt bilde her ;)
Hva er en korrelasjonskoeffisient (r)?
= et mål på samvariasjon mellom to variabler.
Pearsons r er mest brukt.
r har alltid verdier mellom +1 og -1
+1 er perfekt positiv samvariasjon
-1 er perfekt negativ samvariasjon
0 er ingen samvariasjon