Statistik Flashcards

(54 cards)

1
Q

Vad finns det för två huvudinriktningar inom statistik?

A

Deskriptiv statistik: beskriver variablerna som mätts i ens stickprov
(sammanfattade värden som exempelvis: medelvärde, korrelation)

Inferentiell statistik: försöker att använda stickprovet för att dra slutsatser som en population
(statistiska världen, p-värden, konfidensintervall)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

beskriv de 5 stegen i en statistisk analys?

A
  1. klargör syftet med den statistiska analysen
  2. definera mått/skala, statistiskt verktyg och stickprov
  3. redovisa deskriptiv statistik för variablerna i stickprovet
  4. genomför den inferentiella statistiken (om det är målet)
  5. tolka resultaten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

vad är en population?

A

alla möjliga deltagare av den grupp vi är intresserade av (alla högskolestudenter i sverige), ofta svårt att mäta i fullo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

vad är stickprovet?

A

de deltagare vi faktiskt gör mätningar på och observerar

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

vad är en parameter?

A

en parameter är “ett sant” värde i populationen, exempelvis: det sanna medelvärdet för alla högskolestudenter i sverige.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

vad är ett estimat?

A

värdet vi observerar i stickprovet, exempelvis medelvärdet för våra deltagare.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

vad är en variabel?

A

något vi mäter i vårt stickprov.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

vilka två frågor ska man ställa sig i den första delen av en statistisk analys då man ska klargöra syftet med den statistiska analysen?

A
  1. vad för typ av statistik är vi intresserade av?
  2. (om inferentiell statistik) vad är vår hypotes?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

hur man vi avgöra vilken statistik vi kan använda oss av för att den ska bli värdefull?

A
  1. avgöra vilken skalnivå vår variabel är på

Nominalskala
Ordinalskala
Intervallskala
Kvotskala

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

vilket statistiskt verktyg vi använder oss av påverkas av…..

A
  1. skalnivå
  2. forskningsfrågan
  3. om antaganden bakom olika statistiska test är uppfyllda
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

vad är två faktorer som kan göra att vårt stickprov blir dåligt?

A
  1. vi har låg representativitet = svårt att dra inferentiella slutsatser
  2. vi har mätfel i stickprovet = även svårt att ge bra deskriptiv statistik.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

deskriptiv statistik ska redovisas även när…..

A

målet är inferentiell statistik

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

varför ska deskriptiv statistik redovisas även när målet är inferentiell statistik?

A

ex. hjälper oss att avgöra om antaganden för olika test är uppfyllda.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

när vi vill få oss en bild av stickprovet behöver vi ställa oss 4 frågor om det, vilka är dessa?

A
  1. finns det någon spridning i variabeln?
  2. finns det uppenbara mätfel?
  3. finns det skillnader mellan grupper?
  4. finns det andra confounding variables som kan ha påverkat resultatet?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

vad finns det för 3 frågor vi ställer oss när vi tolkar våra resultat?

A
  1. hur kompatibelt är estimat i stickprovet med olika parametrar (sanna värden) i populationen?
  2. hur stor vad skillnaden/hur starkt var sambandet?
  3. finns det hot mot slutsatserna vi vill dra? (mätfel, confounds)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

vad är ett centralmått? beskriv de tre olika typerna av centralmått.

A

ett centralmått mäter den övergripande positionen/läget för en variabel.

typvärde: det vanligaste värdet
median: det mittersta värdet
medelvärde: det genomsnittliga värdet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

vilka centralmått tenderar att vara samma då fördelningen är värdena är ungefär symetrisk?

A

Om fördelningen av våra värden är symmetrisk (normalfördelning ex.) så är median och medelvärde ungefär densamma.

Om de vanligaste värdena också är i mitten är också typvärdet ungefär detsamma.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

vad gäller för centralmått ifall fördelningen av värdena är skev?

A

Om fördelningen av värdena är skev så är median, medelvärde och typvärde ofta ganska olika och det kan därför vara missvisande att bara använda ett centralmått i sådana fall.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

vad är medelvärdet?

A

summan av alla observationer på en variabel delat med antalet observationer.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

vad innebär det att ett stickprovsmedelvärde är väntevärdesriktigt (unbiased på engelska)?

A

det innebär att medelvärdet av alla stickprovsvärden i oändligt upprepade slumpmässigt dragna stickprov kommer vara lika med det sanna populationsmedelvärdet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

vad innebär det att vi har ett konsekvent estimat?

A

har vi ett konsekvent estimat så kommer stickprovsmedelvärdet närma sig det sanna populationsmedelvärdet om vi samlar fler och fler observationer.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

vad är ett spridningsmått? beskriv de 3 typerna av spridningsmått?

A

Ett spridningsmått mäter hur utspridda värdena på en variabel är.

Variationsbredd: skillnaden mellan det högsta och det lägsta värdet

Percentiler och kvartiler: hur många procent/kvartiler av värdena som ligger under det värdet.

Standardavvikelse och varians: mått på genomsnittlig variation

23
Q

vad är stickprovs-standardavikelsen?

A

Roten ur summan av kvadraten av alla avvikelser från medelvärdet delat med antal observationer minus 1.

24
Q

hur räknar man ut stickprovs-standardavvikelsen steg för steg?

A
  1. räkna ut medelvärdet
  2. ta skillnaden mellan varje värde och medelvärdet
  3. kvadrera dessa
  4. summera allt (enligt formeln)
  5. dela resultatet med n-1
  6. ta kvadratroten ur resultatet
25
vad säger Z-värden?
z-värden säger oss hur många standardavvikelser från medelvärdet som är observation är. z nedhöjt till (x,i) z(x,i) = 1.2
26
vad innebär att z(x,i) = 1.2?
att observation (i) på x-variabeln är 1.2 x-standardavvikelser över x-medelvärdet.
27
vad innebär z(y, i) = -0.7
att observation (i) på y-variabeln är 0.7 y-standardavvikelser under y-medelvärdet.
28
nämn 2 av många variabler som ofta är normalfördelade?
längd, reaktionstid.
29
normalfördelningen bestäms av....
dess medelvärde och standardavvikelse
30
varför vill vi mäta en normalfördelad observations z-värde?
för då vet vi hur vanligt det är att få observationer längre ifrån medelvärdet än detta.
31
hur hög chans är det att få ett z-värde mellan -1.96 och +1.96?
95% chans
32
vad för sorts graf kan man använda för att redovisa fördelningen av variabler, nämn några sådana typer?
frekvensgrafer används för att redovisa fördelningen av variabler. 1. barplot 2. histogram 3. boxplot 4. scatterplot
33
vad visar en barplot?
antalet observationer för varje värde på en begränsad kategorisk variabel.
34
vad visar ett histogram?
ett histogram visar antalet observationer i olika spann av värden för en mer kontinuerlig variabel.
35
vad är en kategorisk variabel?
en variabel som bara kan anta ett visst (ofta litet) antal värden. tex: antal 1, 0, 2.
36
vad är en kontinuerlig variabel?
en variabel vars värden kan anta alla värden inom något spann.
37
vad visar en boxplot?
ett låddiagram visar median samt kvartiler/percentiler.
38
vad visar en scatterplot?
värden på två variabler samtidigt, bra för att se samband.
39
vad är en korrelation? vad innebär det att den kan vara positiv eller negativ?
En korrelation är ett mått på samvariation Positiv korrelation innebär att högre värden på ena variabeln hänger samman med högre värden på den andra variabeln och vice versa. Desto starkare sambandet är desto närmare är korrelationen 1, eller -1 (för negativa korrelationer).
40
vad mäter pearsons produktmoment-korrelationskoefficient? (r)
mäter styrkan på linjära samband mellan variabler
41
nämn 3 sanningar om pearsons produkt-moment korrelationskoeffectient (r)
1. mäter endast linjära samband 2. påverkas mycket av extremvärden 3. kräver tillräckligt med variation i båda variablerna för att få ett meningsfullt resultat.
42
hur vet man om en korrelation (r) är relevant?
Enligt cohen fanns det vissa värden på (r) som indikerade en svag, medelstark och stark korrelation. Detta är dock rätt godtyckligt, och det kan vara godtyckligt vad man uppfattar som en stark korrelation mellan två variabler. Korrelationernas praktiska betydelse beror mycket också på vilka de två variablerna är. Desutom beror den upplevda styrkan av korrelationen på ifall korrelationen är statistiskt signifikant eller inte.
43
för att förtydliga vad statistisk signifikans och korrelation (r) är för någonting. vad är det vi ställer oss för fråga när vi ska testa den statistiska signifikansen hos en korrelation?
Hur ovanligt vore det att få minst en så pass stark korrelation som vi har fått i stickprovet om korrelationen i populationen var lika med noll. Om tillräckligt ovanligt (dvs lägre än 5% chans) så tas detta som en indikation på att korrelationen i populationen inte är noll.
44
vad är spearmans rangkorrelationskoefficient (r,s)? när används denna koefficient?
baserat på observationers rangordning. lägsta observation har (rs) = 1, nästa har (rs =2) osv. Om två eller flera observationer är lika så delar de på sin ranksumma rs (=3) rs (=3). används när: 1. data är på ordinalskala 2. när data inte är normalfördelade 3. när det förekommer extremvärden (kan även användas för monotona och icke-linjära samband).
45
vad är regression? vad används till för?
Regression används för att predicera värden på en varibel (y) utifrån värdet på en annan variabel (x). Vi har en scatterplot och försöker att se vilken linje som bäst fångar sambandet mellan variablerna. En dator kan räkna ut vilken av alla möjliga linjer där punkterna har minst avstånd i från linjen, och detta blir vår korrelation.
46
linjen i en regression definieras av:
1. Intercept: vart linjen skär sig i y-axeln 2. Lutning: hur många steg i y-led längs med linjen som motsvaras av ett steg i x-led. Just nu tittar vi på enkel linjär regression: en variabel prediceras av en annan variabel.
47
48
vad är formeln för en enkel regressionsanalys?
y ^ = b 0 + b 1 x b 0 = vart linjen skär i y-axeln (intercept) b 1 = linjens lutning
49
hur räknas linjens lutning vanligtvis ut i en enkel regressionsanalys?
statistiska datorprogram kan räkna ut minsta kvadratavvikelse för att hitta en linje som bäst representerar våra datapunkter. Det betyder att linjen väljs så summan av alla kvadrerade avvikelser från linjen (i y-led) är så liten som möjligt.
50
hur kan man tolka sitt resultat av en enkel regressionsanalys?
b 0 kan ses som "basnivå" och b1 som ett mått på hur mycket den beroende variabeln beror på den oberoende variabeln. om korrelationen är signifikant verkar det gå att predicera till vår population med variabeln (b1) för då tror vi att det finns ett linjärt samband mellan dem.
51
vad är två saker som är viktiga att tänka på när man tolkar sin regressionsanalys?
1. viktigt att ta hänsyn till vilka värden på variablerna som faktiskt observerats och inte försöka förutsäga värden som inte existerar eller som går långt utanför det observerade 2. eftersom att regressionsanalysen utgår ifrån pearsons (r) så är den därmed också påverkad av extremvärden.
52
vill vi dra inferenser KRÄVER detta....
ett slumpmässigt draget stickprov (så att alla i populationen har samma chans att hamna i stickprovet).
53
hur brukar man i praktiken formulera sin statistiska hypotes
man brukar inte säga att man tror att det finns ett 100% samband mellan två variabler, utan man brukar dela upp sina hypoteser i om en effekt går i en riktning eller inte. sanna hypoteser blir de där en effekt går i den förväntade riktningen, medan falska hypoteser blir när de inte går i den riktningen. i praktiken testas då H(0) = ingen effekt mot H(1) = en effekt i förväntad riktning. Detta kallas för null-hypothesis testing.
54
noll-hypotesen innebär att vi inte längre....
talar om hypoteser som vi tror är sanna eller falska, utan bara om hypoteser som vi tror är sanna.