5. Deskriptiv Statistik - Metod II Flashcards

(63 cards)

1
Q

Vad är målet med dataanalys enligt föreläsningen?

A

Att se om våra data stöder ett påstående om kognition eller beteende.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad innebär det att skapa en sammanhängande berättelse i dataanalys?

A

Det innebär att förklara fynden, bemöta motsatta tolkningar och rättfärdiga slutsatser.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vilka delar ingår i att skapa en sammanhängande berättelse enligt föreläsningen?

A

Experimentdesign (kap 6–8)
Deskriptiv statistik (kap 11)
Inferentiell statistik (kap 12)
Skriftlig presentation (kap 13)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad krävs för att dataanalys ska vara meningsfull?

A

Att datan är av god kvalitet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vilka tre faktorer nämns som viktiga för att data ska vara av god kvalitet?

A

Lämplig forskningsfråga
Intern och extern validitet
Studie med hög känslighet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Kan man rädda ett dåligt experiment med dataanalys?

A

Nej, det går inte att “rädda” ett dåligt experiment genom dataanalys.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad måste man veta innan man gör en datorstödd analys? Vad måste man kunna göra efter att programmet analyserat?

A

Vad man vill analysera och hur – det kan inte programmet hjälpa till med.

Tolka utmatningen (resultaten) från programmet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Varför används datorer vid dataanalys? Vad krävs för att göra datorstödd dataanalys?

A

Datorer används ofta eftersom de underlättar och effektiviserar analysarbetet.

Goda kunskaper i experimentdesign och statistik.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Ge exempel på statistikprogram som kan användas för dataanalys.

A

BMDP, SAS, SPSS, STATA, R, JASP, JAMOVI.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad är en nominal variabel? Vad är exempel på värden för nominalskala?

A

En variabel med kategorier utan inbördes ordning, t.ex. grupp eller kön.

Grupp 1, grupp 2, grupp 3 / kvinna, man.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad är en ordinal variabel? Ge exempel på ordinala värden.

A

En variabel med rangordning, men utan exakt avstånd mellan nivåerna.
Låg, medel, hög / före, under, efter.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad är en intervall- eller kontinuerlig variabel? Ge exempel på värden för intervall/scale-variabler.

A

En variabel med mätvärden där avstånden är meningsfulla, t.ex. poäng eller svarstid.

34 poäng, 780 ms.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vilka två typer av dataanalys nämns beroende på typ av studie?

A

Experiment – för att undersöka effekt (dvs kausalitet)
Survey (enkäter) – för att undersöka korrelation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vad är syftet med experimentell dataanalys?

A

Att undersöka om det finns en orsak–verkan-relation (kausalitet).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vad är syftet med surveydataanalys (enkäter)?

A

Att undersöka samband mellan variabler, alltså korrelation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vilka är de tre stadierna i dataanalys vid experiment?

A
  1. Lära känna datan
  2. Sammanfatta datan
  3. Bekräfta vad datan avslöjar
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vilka statistiska typer används i de tre stadierna av experimentell dataanalys?

A

Steg 1 och 2: Deskriptiv statistik
Steg 3: Inferentiell statistik

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Vad är skillnaden mellan deskriptiv och inferentiell statistik?

A

Deskriptiv statistik beskriver och sammanfattar data från ett urval, t.ex. medelvärde, standardavvikelse och diagram.

Inferentiell statistik drar slutsatser om en population baserat på data från ett urval, t.ex. genom konfidensintervall och hypotesprövning.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Vad ingår i att bekräfta vad datan avslöjar?

A

Konfidensintervall
Nollhypotesprövning

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Vad handlade vokabulärstudien om?

A

191 ord presenterades för 26 studenter och 26 äldre personer, i form av flervalsfrågor med fem alternativ.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Vad innebär steget “lära känna datan”?

A

Att “rena” datan: ta bort saknade eller orimliga värden
Att se om datan är meningsfull
Att transformera datan: byta enhet eller räkna om till procent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Vad visar exemplet med studenter och äldre i vokabulärstudien?

A

Procent korrekta svar i två grupper, t.ex. för att kunna jämföra fördelning och skillnader i prestation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Vad är ett stam- och blad-diagram (stem-and-leaf) bra för?

A

Att hitta outliers (extremvärden)
Att se hur värdena i datan är fördelade

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Vad betyder raden: 3* | 01 i ett stam-och-blad-diagram?

A

Det betyder att det finns två värden: 30 och 31
(stam = 3 = 30-tal, blad = 0 och 1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Vad visar stam-och-blad-diagrammet på slide 12?
Det visar en lista av procentvärden i grupperade tiotal, där man enkelt kan se hur många som fått liknande resultat och om det finns extremvärden (outliers).
24
Vad visar stem-and-leaf-diagrammet i slide 13 för äldre och studenter?
Det visar en översikt av deltagarnas resultat i procent, uppdelat i tiotal, så man kan jämföra fördelningen mellan äldre och studenter.
25
Vad visar slide 14 med klockformen?
Den visar normalfördelningen, en vanlig typ av fördelning där de flesta värden ligger i mitten och färre i kanterna – kallas också för "bell curve".
26
Varför är normalfördelningen viktig i statistik?
För att många statistiska tester utgår från antagandet att data är normalfördelad – det påverkar hur vi tolkar resultat.
27
Vad är en bimodal fördelning?
En fördelning med två toppar, vilket kan tyda på att det finns två olika grupper i datan, t.ex. yngre och äldre med olika resultat.
28
Varför kan outliers vara ett problem i dataanalys?
Förstör medelvärdet – de drar upp eller ner snittet Gör det svårare att hitta riktiga mönster – de lägger till "stök" i datan Kanske inte är riktiga – de kan bero på fel, slarv eller missförstånd
29
Hur kan outliers göra effekter mer svårupptäckta i statistiska tester?
De ökar variationen i datan → testet får svårare att avgöra om en skillnad är äkta eller bara slump. Det gör det svårare att upptäcka riktiga effekter.
30
Vad kan orsaka outliers?
Mätfel eller inmatningsfel – Något gick tekniskt fel, t.ex. någon skrev 960 istället för 96. Deltagare som inte följer instruktioner – T.ex. gissar, slarvar eller missförstår uppgiften. Något oväntat men viktigt – En person gör något annorlunda och får ett extremt bra (eller dåligt) resultat som kan ge nya insikter!
31
Ska man ta bort outliers?
Man får ta bort en outlier endast om man har goda skäl, för att det påverkar validiteten i resultatet. Här är tre viktiga villkor: 1. Man har tydliga kriterier i förväg Regler för vad som räknas som outlier ska vara bestämda innan du ser datan. Exempel: “Tar bort alla reaktionstider över 3000 ms” Inte: “Oj, den här ser konstig ut, vi tar bort den…” 2. Det beror på vad man mäter I vissa fall kan outliers förstöra analysen (t.ex. mätfel), men i andra är de meningsfulla fynd. Exempel: I en teststudie om minne → någon kanske sov = irrelevant I en studie om individers kreativitet → den som tänker annorlunda kan vara just det du vill undersöka 3. Forskaren gör en medveten och motiverad bedömning Du måste kunna förklara exakt varför du tog bort värdet – och kunna redovisa det i din rapport. “Personen svarade på 191 frågor på 15 sekunder = orimligt” “Deltagaren fyllde i samma alternativ på allt = uppenbart icke-deltagande”
32
Vad är ett boxplot (låddiagram)?
Ett boxplot visar hur datan är fördelad. Det visar: Medianen (mittenvärdet) Övre och nedre kvartil (Q1 och Q3) Min och max (utan outliers) Eventuella outliers (som prickar) Det är ett snabbt sätt att se spridning, mittpunkt och symmetri i datan.
33
Vad är kvartiler (Q1, Q2, Q3)?
Q1 = värdet som delar av de lägsta 25% Q2 = medianen (mittenvärdet) Q3 = värdet som delar av de högsta 25% Datan delas alltså i fyra lika stora delar med 25% i varje.
34
Vad är interkvartilintervall (IQR)?
IQR = Q3 – Q1 Det visar hur "tjock mitten" av datan är, alltså hur mycket de mittersta 50 % av värdena sprider sig. Det är ett mått på spridning som inte påverkas av outliers.
35
Hur räknar man ut IQR för hand?
Sortera siffrorna i ordning Hitta medianen (Q2) Dela datan i två halvor: Lägre halvan → hitta Q1 Övre halvan → hitta Q3 Subtrahera Q1 från Q3 Exempel: Siffror: 1, 2, 5, 6, 7, 9, 12, 15, 18, 19, 27 Q1 = 5 Q3 = 18 IQR = 18 – 5 = 13
36
Hur räknar man ut IQR för jämnt antal värden?
Sortera alla siffror Hitta mitten (två värden i mitten) Dela datan i två lika stora halvor Hitta Q1 (medianen i nedre halvan) Hitta Q3 (medianen i övre halvan) Räkna: IQR = Q3 – Q1 Exempel: Siffror: 3, 5, 7, 8, 9, 11, 15, 16, 20, 21 Q1 = 7 Q3 = 16 IQR = 16 – 7 = 9
37
Vad betyder att outliers ligger utanför 1,5 × IQR?
Enligt boxplot-regeln är ett värde en outlier om det är: Mindre än Q1 – 1,5 × IQR Större än Q3 + 1,5 × IQR Det hjälper till att hitta värden som sticker ut mycket från resten. Viktigt: Det är forskaren som bestämmer om de ska tas bort – inte regeln i sig.
38
Vad betyder siffran 1,5 i regeln för outliers (1,5 × IQR)?
Det är en tumregel som används för att avgöra om ett värde är tillräckligt långt bort från mitten för att räknas som outlier. Man säger: "Om värdet är mer än 1,5 gånger IQR från kvartilerna → det är misstänkt extremt." Det är inte en exakt gräns – bara en hjälp för att hitta avvikande värden.
39
Vad visar ett boxplot (låddiagram)?
Ett boxplot visar: Medianen (strecket i mitten av boxen) Nedre kvartil (Q1) och övre kvartil (Q3) Minsta och största värde (utan outliers) Outliers visas ibland som punkter Det hjälper dig snabbt se fördelning, spridning och symmetri i datan.
40
Vad är deskriptiv statistik och centralmått?
Deskriptiv statistik är sätt att sammanfatta och beskriva data, t.ex. med: Medelvärde (mean) – genomsnitt Median (median) – mittersta värdet Typvärde (mode) – det vanligaste värdet Man visar ofta datan grafiskt, t.ex. med boxplot, stapeldiagram eller histogram.
41
Vad visar skämtbilden “Sneaky Averages”?
Den visar att medelvärdet (average) ibland kan lura oss. I bilden står det: “Average depth: 3 ft” Men en person har trillat ner i en djup del och håller på att drunkna! Poängen är: Medelvärdet säger inget om variationen i datan Det kan dölja extrema skillnader Det kan låta bra, men vara missvisande i verkligheten Lärdom: Alltid kolla mer än bara medelvärdet. T.ex. median, spridning, IQR och visualiseringar.
42
Vad visar tabellen med College vs Older Adult på slide 25?
Tabellen jämför centralmått (medelvärde, median, typvärde) i vokabulärtestet: Mått College Older Adult Mean 45.58 - 64.04 Median 46.00 - 64.50 Mode 38, 42, 48, 59 - 78 Det visar att äldre deltagare presterade bättre, både i snitt och på medianen.
43
Vad betyder "skewness" (snedfördelning) i en fördelning?
Skewness = hur sned datan är, alltså om det finns fler låga eller höga värden som "drar" kurvan åt ett håll. Negativ skew (vänsterskev): Median > Medelvärde → svansen drar åt vänster Symmetrisk kurva (bell-shaped): Mode ≈ Median ≈ Mean → jämnt fördelad Positiv skew (högerskev): Median < Medelvärde → svansen drar åt höger Skewness påverkar vilket mått (mean/median) som bäst representerar datan.
44
Vad är standardavvikelse och varians?
De är mått på spridning i datan – alltså hur mycket värdena skiljer sig från medelvärdet. Standardavvikelse (SD): visar genomsnittlig avvikelse från medelvärdet Varians (SD²): är SD upphöjt till 2 Ju större SD → desto mer utspridd data Ju mindre SD → desto mer samlad data
44
Vad är varians och standardavvikelse (SD)?
Varians är ett mått på hur mycket värdena i datan skiljer sig från medelvärdet – alltså hur "spridda" de är. Men! Varians använder kvadraten på avstånden från medelvärdet, så den blir i en konstig enhet. Standardavvikelse är bara kvadratroten av variansen, så att måttet blir i samma enhet som själva datan (t.ex. procent, sekunder, poäng).
45
Vad visar kurvorna i grafen på slide 28?
De visar normalfördelningar med olika spridning (SD): Smal och hög kurva (röd) = låg SD → data är koncentrerad Bred och platt kurva (blå) = hög SD → data är utspridd Alla kurvor har ungefär samma medelvärde (i mitten), men olika bredd. Ju större SD, desto bredare och lägre blir kurvan.
46
Vad visar graferna med hög, medelhög och låg varians (slide 29)?
De visar hur spridningen i datan påverkar formen på kurvan: Hög varians: Bred och platt kurva → värdena är väldigt utspridda Medelhög varians: Normal bredd → lite variation Låg varians: Smal och hög kurva → värdena ligger nära medelvärdet Ju större varians = ju mer olika är deltagarna från varandra.
47
Vad betyder det att "68 % ligger inom ±1 SD"?
Det betyder att ungefär 68 % av alla värden i en normalfördelad datamängd ligger inom ett standardavvikelse-intervall runt medelvärdet. Exempel: Om medelvärdet = 50 och standardavvikelsen (SD) = 10 Då är: ±1 SD = 50 ± 10 → alltså mellan 40 och 60 → 68 % av deltagarna ligger mellan 40 och 60
48
Vad betyder "95 % ligger inom ±2 SD"?
Att nästan alla (ca 95 %) ligger inom två standardavvikelser från medelvärdet. Exempel: ±2 SD = 50 ± 20 → alltså mellan 30 och 70 → Endast ca 5 % ligger utanför detta område
49
Vad är standardfel och varför används det?
Standardfel (SE) = hur mycket medelvärdet i ett urval kan skilja sig från det sanna medelvärdet i populationen. Standardfel (SE) visar hur säkert ditt medelvärde är – alltså hur mycket det kan variera om du hade tagit andra deltagare. Det mäter osäkerhet i medelvärdet. Litet SE → du kan lita mer på ditt medelvärde Stort SE → du är mer osäker Det beror på: SD → ju större spridning, desto mer osäkert N → ju fler deltagare, desto säkrare medelvärde Litet SE = bra uppskattning Stort SE = osäkert medelvärde
50
Vad visar tabellen på slide 31?
Den visar spridningsmått (range, varians, SD) för College och Older Adult i vokabulärstudien: Mått College Older Adult Range 23–62 32–83 Variance (s²) 109.45 150.44 SD (s) 10.46 12.27 Äldre vuxna hade högre spridning i resultat (både varians och SD). Notera: Standardavvikelse kan skrivas som SD eller s i olika texter!
51
Vad är effektstorlek (Cohen’s d)?
Effektstorlek visar hur stor skillnaden är mellan två grupper, i förhållande till spridningen i datan. Det säger hur meningsfull skillnaden är – inte bara om den är statistiskt säker. Beräknas så här: Skillnaden i medelvärden / Samlad standardavvikelse → Ju högre d, desto större effekt
52
Vad betyder d = 1.65 i vokabulär-exemplet?
Det betyder att skillnaden mellan grupperna är stor jämfört med hur mycket värdena varierar inom grupperna. Tolkning av d (enligt Cohen): 0.2 = liten effekt 0.5 = medelstor effekt 0.8 eller mer = stor effekt → Ditt exempel hade d = 1.65 → väldigt stark effekt!
53
Vad betyder ett 95 % konfidensintervall?
Det betyder att om vi upprepade samma studie 100 gånger, så skulle 95 av 100 intervall täcka det sanna värdet i populationen. Ju smalare intervall, desto säkrare uppskattning Större stickprov (sample size) → bättre uppskattning Används ofta för att visa medelvärden, men också skillnader mellan grupper.
54
Vad är en korrelationsstudie?
En korrelationsstudie undersöker om två saker hänger ihop – t.ex. om mer sömn ger bättre testresultat. Det visar ett samband, men inte orsak! Typiskt i survey- eller observationsstudier
55
Hur analyserar man en korrelationsstudie?
Man följer tre steg: Lära känna datan (rensning, förstå värdena) Sammanfatta datan (t.ex. med medelvärde eller spridning) Skapa konfidensintervall för korrelationen → för att se om sambandet är säkert (signifikant) Om konfidensintervallet inte innehåller 0, så är sambandet statistiskt signifikant.
56
Hur sammanfattar man data i en korrelationsstudie?
Man gör tre saker: Ritar ett spridningsdiagram (scatterplot) Tittar efter ett mönster – går punkterna i en linje? Beräknar korrelationskoefficienten (r) – Om positiv: värdena ökar ihop – Om negativ: ena ökar, andra minskar
57
Vad visar ett spridningsdiagram?
Korrelation visar hur två saker rör sig tillsammans. Typ: när X ändras, händer något med Y? Positiv korrelation När X ökar, ökar också Y Exempel: Ju fler timmar du pluggar → desto bättre poäng på tentan Ser ut som en uppåtsluttande linje i diagrammet Negativ korrelation När X ökar, minskar Y Exempel: Ju fler timmar du scrollar TikTok → desto sämre sömn Ser ut som en nedåtsluttande linje i diagrammet Ingen korrelation X och Y har ingen tydlig koppling Exempel: Hur många glassar du äter i veckan ↔ hur lång du är (De har ingen relation – mer glass gör dig inte längre) Ser ut som ett kaos av prickar utan mönster
58
Vad är Pearson’s korrelationskoefficient (r)?
Det är ett mått som visar hur starkt två saker hänger ihop, och åt vilket håll sambandet går. r = 1 → perfekt positiv korrelation r = -1 → perfekt negativ korrelation r = 0 → inget samband Tolkning av r: 0–0.25 = svag 0.25–0.75 = måttlig 0.75–1 = stark Pearson’s r mäter linjära samband (kan bara visa raka trender).
59
Hur vet man om en korrelation är statistiskt signifikant?
Man testar om korrelationen (r) i stickprovet är så tydlig att den troligen finns i hela populationen. Man kollar p-värdet (Sig.) i t.ex. SPSS Om p < 0.05 → korrelationen är signifikant (inte bara slump) r visar styrkan på sambandet p visar hur säkert sambandet är
60
Vad betyder Pearsons korrelationsformel (r)?
Formeln räknar ut hur starkt två saker hänger ihop – till exempel om mer plugg → bättre testresultat. Den jämför: Hur mycket X och Y ändras tillsammans Med hur mycket de varierar var för sig Formeln innehåller: ∑XY = hur X och Y rör sig ihop ∑X², ∑Y² = hur mycket varje variabel varierar N = antal datapunkter Resultatet är ett värde mellan -1 och +1: +1 = perfekt positivt samband -1 = perfekt negativt samband 0 = inget samband Du behöver oftast inte räkna för hand – bara förstå vad r betyder.