Statistik Flashcards
(110 cards)
beskriv snabbt vilka tre huvudsakliga typer av forskningsstudier man kan göra, samt hur dessa förhåller sig till kontroll av OV och randomisering
Experiment: Kontroll OV (JA), Randomisering (JA)
Kvasi-experiment: Kontroll av OV (JA), Randomisering (NEJ)
Icke-experiment: Kontroll av OV (NEJ), Randomisering (NEJ).
vad handlar intern validitet om?
var det BV som stod för effekten i OB eller kan det finnas några andra bakomliggande variabler?
vad finns det för två problem med den interna validiteten som vi kan tänka oss vid icke-experiment (såsom korrelationsstudier)
- Riktningsproblemet
-Bakomliggande-variabel problemet.
hur kan man dela upp variabler?
kvalitativ: “ord”
Kvantitativ: “nummer”
kvantitativ diskret: antar bara vissa värden
kvantitativ kontinuerlig: kan anta alla värden.
vad säger mätinstrumentets reliabiltet?
hur pålitligt instrumentet är för att mäta det som det avser att mäta. hur litet det påverkas av slumpmässiga fel.
vad säger mätinstrumentets validitet?
huruvida instrumentet verkligen mäter det som det ska mäta. dess giltighet.
varför är det viktigt i ett stolpdiagram att y-axeln börjar på noll
för att kunna återge staplarnas egentliga areor, och undvika att grafiskt redovisa väldigt små skillnader som större än de egentligen är.
vad är relativ frekvens?
iantal förekomster av något variabelvärde dividerat med det totala antalet.
vad är kumulerad frekvens (F)
innebär att frekvenserna adderas kumulativt nedåt (eller uppåt) i frekvenstabellen.
varför är det bra att rita stapeldiagram respektive histogram över sina variabler?
för att se fördelningsformen (frekvensfördelningen) samt att hitta extremvärden (outliars).
vad innebär det att summera kumulativt?
att summera nedåt (eller ibland uppåt) i en kolumn.
vilka centralmått finns det? beskriv dem?
typvärde: det mätvärde med högst frekvens
median: mittersta värdet om variablerna rankas i storleksordning.
medelvärdet: summan av observationerna delad med antal observationer.
vad kallas en fördelning med två toppar (alltså när man har TVÅ typvärden)?
en bimodal fördelning
vad är ett särskilt lämpligt centralmått för snedfördelade variabler?
median. men ett problem med median, såsom med typvärde, är att den kan variera mycket från stickprov till stickprov vilken kan bli problematiskt om vi vill generalisera våra resultat till en större population.
medianen i ett stickprov är alltså inte något effektivt estimat av medianen i motsvarande population (parameter)
detta kan dock lösas med att ha ett väldigt stort stickprov. i riktigt stora stickprov har förstås inte slumpen någon möjlighet att slå så väldigt olika inte ens på medianen.
vilka två tecken används för att
1. beskriva medelvärdet i stickprovet (estimat)
2. beskriva medelvärdet i populationen (parameter)
- x bar
- μ (my)
vad innebär tecknet Σ och hur ska det utlösas?
Σ = summan
innebär att vi ska summera det som står till höger om tecknet.
vad innebär tecknet n?
n = antalet observationer.
vad är en kvadratsumma?
kvadratsumma = en summa av kvadrerade avvikelser från ett medelvärde.
vad blir alltid summan av alla avvikelser från det aritmetiska medelvärdet?
noll.
summan av alla avvikelser från det aritmetiska medelvärdet blir alltid noll.
nämn egenskaper hos det aritmetiska medelvärdet som har gjort att det använts mycket oftare än andra centralmått som typvärde och median.
- medelvärdet i ett stickprov är ett effektivt estimat av motsvarande parameter
(pga, slumpmässiga skillnader jämnar ut sig och blir mycket små).
- medelvärdet är ett väntevärdesriktigt estimat av parametern.
(slumpen gör att skillnader jämnar ut sig). inget säger att vi alltid skulle råka få lite för små eller stora resultat, så de bör jämna ut sig vid flera stickprov. gör man oändligt många nya stickprov och tar medelvärde på dom, bör det gemensama medelvärdet för alla stickprov att komma väldigt nära det sanna populationsmedelvärdet.
uttrycks som:
E= expected value
E = (x̄) = μ
alltså: det förväntade genomsnittliga värdet av stickprovsmedelvärdet är lika med populationsmedelvärdet.
- medelvärdet går att beräkna algebraiskt, vilket för det lättare att använda då man ej behöver redogöra för sin procedur och det blir behändigt och lätt att bygga vidare på.
vad gäller median, typvärde och medelvärde om vi har en perfekt normalfördelning?
de kommer alla att hamna på exakt samma plats precis i mitten.
vad gäller median, typvärde och medelvärde om vi har en positiv sned fördelning?
centralmåtten kommer att placera sig från vänster till höger i ordningen:
typvärde, median, medelvärde
hur ser man grafiskt ifall man har en positiv eller negativt sned fördelning?
positiv: värdena samlas i vänster hörn.
negativ: värdena samlas i höger hörn.
vad gäller median, typvärde och medelvärde om vi har en negativ sned fördelning?
centralmåtten kommer att placera sig från vänster till höger i ordningen:
medelvärde, median, typvärde.