Statistik Psyk I Flashcards

(55 cards)

1
Q

Vad är en variabel?

A

Variabel

En märbar egenskap vars variation studeras.

  • En variabel är något som kan ändras. Egenskap av ett objekt, person eller händelse som kan ha olika värden. Vi är intresserade av att mäta denna egenskaps variation, Ibland, men inte alltid har variablerna enheter.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad är en nominalskala?

A
  • Värdena kan delas in i grupper/kategorier.
  • Värdena går inte att rangordna.

Variabeln ”Frukt” är t.ex. en nominalskala – det finns bananer, päron, äpplen och så vidare. De är olika, men ingen är mer ”frukt” än någon annan. De går inte att rangordna.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad är en ordinalskala?

A
  • Värdena kan rangordnas.
  • Olika el. icke urskiljningsbara avstånd mellan värdena (har ej ekvidistans).

Ex: En skala som har alternativen ”Mycket bra” ”Ganska bra” ”Varken bra eller dåligt” och så vidare är en ordinalskala.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad är en intervallskala?

A
  • Värdena kan rangordnas.
  • Det är lika stort avstånd mellan värdena (har ekvidistans)

Ex. Meter eller temperatur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vad betyder att en skala har ekvidistans?

A
  • Skalan har lika stort avstånd mellan värdena.

Ex. centimeter är en sådan skala. 5 cm är mer än 4 cm, och avståndet mellan 5 och 4 cm är lika stort som avståndet mellan 4 och 3 cm.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad är en kvotskala?

A
  • Värdena kan rangordnas
  • Det är lika stort avstång mellan alla värden (har ekvidistans)
  • Det finns en absolut 0-punkt.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad betyder operationalisering?

A
  • Definiera mätning av ett fenomen som inte är direkt mätbart.
  • Utformning av centrala begrepp och utformning av mått på begreppen.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vad betyder OV och BV när man talar om variabler?

A
  • Oberoende variabel (OV)

Variabel som kan manipuleras (orsaksvariabel). Anges ofta som X (på X-axeln).

  • Beroende variabel (BV)

Variabel som, antaget, blir påverkad av OV (effekt). Anges ofta som Y (på Y-axeln).

  • Oberoende variabler kan man själv välja värde på, medan en beroende variabel anger resultatet av en beräkning där en eller flera oberoende variabler har använts.
  • Vid beräkning av Body Mass Index är kroppens vikt och längd två oberoende variabler, medan det BMI-värde som beräkningsformeln ger är en beroende variabel. Man säger därför att BMI-värdet är beroende av vikten och längden.
  • Ofta säger man bara variabel men menar egentligen oberoende variabel.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad menas med samband?

A

Samband mellan två variabler, “samvariation” mellan OV och BV.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Nämn tre olika typer av undersökningsdesign.

A
  1. Experiment
  2. Kvasi-experiment
  3. Icke-experiment
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad är ett experiment?

A

Ett äkta experiment kännetecknas av två saker;

  • Kontroll av OV.
  • Randomisering av individer till betingelser.

Experiment är den bästa undersökningsdesignen när det gäller att komma fram till slutsatser om orsak och verkan, Kausalitet, hur OV påverkar BV. Randomisering innebär att man låter slumpen avgöra vilken betingelse undersökningsdeltagarna ska hamna i.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vad är kvasiexperiment och varför gör man kvasi-experiment?

A

Kvasiexperiment

  • Kontroll av OV.
  • Ingen randomisering av individer till betingelser.

Fördelar inte personer till experiment- och kontrollgrupp genom randomisering. Vilket får till följd att det kan finnas en annan bakomliggande variabel, snarare än OV, som leder till effekterna på BV.

Varför gör man då kvasi-experiment? Ibland finns ingen annan möjlighet att undersöka frågeställningen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vad är ett icke-experiment/korrelationsstudie och varför väljer man den designen?

A

Icke-experiment / Korrelationsstudie

  • Ingen kontroll av OV.
  • Ingen randomisering av individer till betingelser.
  • I stället - Observera & försöka hitta samband mellan OV och BV.
  • Använda komplexa statistiska metoder för att utesluta skensamband dvs. att orsakssamband går från BV till OV istället för tvärtom.
  • Slutsatsen om det var OV som påverkade BV är aldrig så säkert som med ett experiment.

Varför använder man sig av korrelationsstudier? Man har inget annat alternativ att studera visa frågeställningar, t.ex. av etiska anledningar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vad menas med den experimentella designen, enfaktoriell design?

A

Enfaktoriell design

En oberoende variabel (OV).

Till exempel: Hur påverkas en persons längd (OV) samma persons resultat på 100 meter löpning (BV).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vad menas med den experimentella designen, flerfaktoriell design?

A

Flerfaktoriell design

2 eller fler oberoende variabler (OV)

Exempel: Vid beräkning av Body Mass Index är kroppens vikt (OV:1) och längd (OV:2) två oberoende variabler, medan det BMI-värde som beräkningsformeln ger är en beroende variabel (BV). Man säger därför att BMI-värdet är beroende av vikten och längden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vad menas med den experimentella designen, mixed design?

A

Mixed design

Mixed design - Både OV och BV mäts, kombinerad inomindividdesign och mellanindividdesign.

Till exempel: Hur påverkas en persons längd (OV:1) samma persons resultat på 100 meter löpning (BV) och är det någon skillnad mellan könen (OV:2).

  • Längd,OV:1 = Inomindivid
  • Kön, OV:2 = Mellanindivid (Mäts och fördelar OV:1)
  • Resultat löpning (BV)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Vad menas med den experimentella designen, inomindividdesign?

A

Inomindividdesign

Undersökningsdeltagarna testas individuellt för samtliga betingelser i studien, sedan sammanställs det totala resultatet för alla undersökningsdeltagare. (Kan i vissa fall inte ses som ett äkta experiment då betingelserna inte slumpats till deltagarna.)

Exempel: Experiment i inkodningsdjup för betingelserna; djup, semiytlig och ytlig. Varje deltagare testas för alla betingelser.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Vad menas med den experimentella designen, mellanindividdesign?

A

Mellanindividdesign

Olika personer för varje betingelse dvs att varje deltagare deltar i endast en betingelse för experimentet.

Exempel: Experiment i inkodningsdjup för betingelserna; djup, semiytlig och ytlig. Betingelserna slumpas till undersökningsdeltagarna som testas för en utav dessa tre betingelser. Totala resultatet sammanställs och jämförs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Var kan ett experiment utföras?

A

I ett labb - Laboratorieexperiment
Ute i fält - Fältexperiment

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Oftast är det hela populationen som man i undersökningar är intresserad av. Men det är omöjligt att undersöka alla dessa individer så i stället får vi nöja oss med ett urval av dessa, ett stickprov, för att sedan generalisera reslutatet av undersökningen till hela populationen.

Vilka 5 olika urvalsmetoder finns det?

A
  • **Osystematisk/slumpmässig **- Alla systematiska metoder för att välja ut stickprovet innebär risk för snedvridning utav resultatet. Slumpmässigt urval är således det mest optimala.
  • Systematisk urval - Ex. var 100:e person, detta kan dock sammanfalla olyckligt med någon okänd periodicitet.
  • Stratifierat urval - Populationen delas in i undergrupper, strata, med hjälp av bakgrundsvariabler (ex. boende i olika städer). Med en förutbestämd/varierande storlek görs sedan ett slumpmässigt urval i var strata.
  • Klusterurval - En redan befintlig enhet används, ex. alla skolor -> 3 skolor -> 5 klasser/skola -> slumpat urval i var klass.
  • **Bekvämlighetsurval **- Man väljer personer som råkar finnas väl till hands. (Behöver dock inte påverka resultatet om man undersöker något som är väldigt allmängiltigt.)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Validitet kan generellt sägas vara att man verkligen mäter det man vill mäta.

Vad innebär intern validitet?

A

Hur stor är säkerheten att OV, och inget annat, påverkar BV?

2 hot:

  • Riktningsproblemet, OV ⇔ BV.
  • Bakomliggande-variabel-problemet
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Validitet kan generellt sägas vara att man verkligen mäter det man vill mäta.

Vad innebär extern validitet?

A

Den externa validiteten handlar om giltigheten att göra generaliseringar från det samband mellan OV och BV som man funnit i undersökningen.

Kan sambandet generaliseras till;

  • Andra sätt att manipulera/mäta OV och BV
  • Andra miljöer än den använda
  • Andra individer än de undersökta
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Vad innebär reliabilitet & validitetet inom mätteori?

A

Mätteori

  • Reliabilitet - Tillförlitligheten hos en mätning & hur mycket kan slumpen eventuellt påverkat resultatet.
  • Validitet - Mäter man verkligen det man avser att mäta?
24
Q

Centralmått anger vad som är det normala, det typiska eller det genomsnittliga värdet för en viss variabel.

  • Ange de tre vanligaste centralmåtten.
A

Centralmått

  • Typvärde (T)
  • Median (Md)
  • Medelvärde (mean)
25
Vad är **Typvärde (T) **för typ av centralmått?
**Typvärde (T) *På engelska "mode".*** * Det mätvärde som har den högsta frekvensen. Ex: 1,3,**2**,3,**2**,**2**,**2**,1 = Typvärde 2 (Det finns flest 2:or.) Typvärdet är i allmänhet inte ett särskillt effektivt mått för att generalisera från ett stickprov till en population. Det är dock särskilt lämpligt i vissa fall, ex. då variabeln bara kan anta ett fåtal olika värden. För variabler på en **nominalskala** är typvärdet det enda form av centralmått som kan komma i fråga, ex. kön. Typvärdet för förskolepersonal i Sverige är "kvinna", ögonfärg i Sverige "blå" medan i Grekland "brun". Man kan ha flera typvärden i en mätning, vid två typvärden dvs. fördelning med två toppar, kallas det ***biomodal fördelning***.
26
Vad är **Median (Md)** för typ av centralmått?
**Median (Md)** * Mittersta mätvärdet för en uppsättning värden. Hälften av alla värden är mindre än medianen och hälften är större och därfär även kallat **50:e percentilen**. Ex. 1,1,2,3,5 = Md 2 / 1,1,1,2,2,5 = (1+2)/2 = Md 1,5 Medianen är ett särkilt lämpligt centralmått för variabler med extremvärden eller snedfördelade variabler, ex. lön där en stor del av befolkningen känar mindre och en liten del av befolkningen känar mycket. Tyvärr så är det samma problem med **medianen** som med **typvärdet**, då den kan variera en hel del från stickprov till stickprov och därför inte ett särskilt bra estimat för hela populationen (**Md** är dock bättre än **T**).
27
Vad är **Medelvärde (mean)** för typ av centralmått?
**Aritmetiskt medelvärde (mean)** * Beräknas som summan av alla observationer (∑), delat med antalet observationer (n). Det i särklass mest använda centralmåttet. Man skiljer på medelvärdet i ett stickprov, x̄ (x-bar), och medelvärdet i hela populationen, μ (my). Medelvärdet påverkas dock av extremvärden.
28
Nämn de fem vanligaste **spridningsmåtten**?
**Spridningsmått/variationsmått** * Variationsbredd * Varians * Standardavvikelse * Kvartilavstånd * Kvartilavvikelse
29
Förklara spridningsmåttet, **variationsbredd**.
**Spridningsmåttet - Variationsbredd (range)** * Det högsta värdet minus det lägsta värdet i datamängden. Variationsbredd = Xmax - Xmin Användbar vid rektangulär, bimodal eller mycket sned fördelning.
30
Förklara spridningsmåttet, **Varians.**
**Spridningsmått - Varians** * Varians är ett mått på hur mycket värdena avviker från medelvärdet (μ) i en serie observationer. * Ju större variansen är, desto större är spridningen bland observationsvärdena. * Varians = Standardavvikelse2 * Varians i ett stickprov är alltid en underskattning av variansen i populationen, bias, division med en mindre siffra ger ett större värde av variansen i stickprovet och mindre bias. * Formeltecken: * I populationen: σ2 (sigma) / I stickprovet: s2
31
Förklara spridningsmåttet, **Standardavvikelse**.
**Spridningsmått - Standardavvikelse** * Med standardavvikelsen menar vi ett mått på den genomsnittliga avvikelsen från medelvärdet (μ) i en serie observationsvärden. * Ju större standardavvikelsen är, desto större är spridningen bland observationsvärdena. * Standardavvikelse = √Varians * Formeltecken: * I opulationen: σ (sigma) / I stickprovet: s
32
Förklara spridningsmåttet, kvartilavstånd.
**Spridningsmått - Kvartilavstånd (IQR)** ***Kvartiler (q) & percentiler (p)*** * **IQR = q3 - q1** * Ett bättre sätt att beskriva spridningen runt medianen är att dela in observationsvärdena i kvartiler. * Kvartil betyder fjärdedel och dessa kvartiler kommer man fram till genom att dela in storlekssorterade observationsvärden i fyra lika stora grupper. ***(50:e percentilen = Medianen)*** * **1**, 2, 3, **_4_**, 5, 6, 7, **_8_**, 9, 10, 11, **_12_**, 13, 14, **15** * min q1 (25%) q2 (50%) q3 (75%) max
33
Förklara spridningsmåttet, kvartilavvikelse.
**Spridningsmått - Kvartilavvikelse (Q)** * Halva kvartilavståndet.
34
Vad innebär **normalfördelning**?
**Normalfördelning** * En normalfördelningskurva har alltid formen av en symmetrisk kulle (klockformad), dvs 50 % av observationsvärdena ligger över respektive under medelvärdet. * Kurvan ser dock olika ut beroende på medelvärdet, som förskjuter kurvan i x-led. * Standardavvikelsen, som ändrar formen på kullen (låg standardavvikelse ger en högre, smalare kulle, medan en hög standardavvikelse ger en lägre, bredare kulle). * Asymptotisk (går från - ∞ till + ∞) * Totalt 100% under kurvan
35
Normalfördelning - Förklara sannolikhet (Probability **(P)**)
**Normalfördelning - Sannolikhet (P)** * **Probability (P)** * **Exempel:** P (­‐0.7 ≤ z ≤ 1) ≈ 0,60 (60%) * Enligt **z-tabellen** befinner sig 24% av observationerna till vänster om ett avstånd på -0,7 standardavvikelser från medelvärdet och 84% av observationerna befinner sig till vänster om ett avstånd på 1 standardavvivelse från medelvärdet, 84% - 24% = 60%. Vilket betyder att 60% av observationerna ligger i intervallet (­‐0.7 ≤ z ≤ 1), så sannolikheten att en observation ska befinna sig i det intervallet är P = 0,6. * Totala ”area under the curve”: 1 eller 100% * Vi kan transformera alla normalfördelningar till en standard genom “z-transformation”. **Värdena hittas i Z-tabellen** så vi måste inte beräkna dem själva via intergraler.
36
Förklara **z-poäng (standardpoäng)**
**Z-poäng (standardpoäng)** * Genom att översätta mätningar på olika skalor till z-poäng så kan vi jämföra dem med varandra och exempelvis säga vilken som är störst. * Z-poäng är en universiell norm som kan tillämpas på data som är normalfördelad eller åtminstone approximativt normalfördelat. * Z-poäng har ett medelvärde (mean) = 0
37
Varför är det möjligt att jämföra värden från olika fördelningar då de har blivit transformerade till z-poäng?
Det är möjligt då olika värden kan antas vara normalfördelade eller i alla fall approximativt normalfördelade och genom att utgå ifrån detta så kan man jämföra värden från olika skalor.
38
Vad är fördelen med att ha 0 som medelvärdet för z-poäng?
**Z-poäng har ett medelvärde (mean) = 0** Fördelen med att ha 0 som medelvärdet är då man ofta är intresserad av att veta hur mycket en variabel avviker från medelvärdet. Genom att sätta 0 som medelvärde så kan man tydligare avläsa hur många standardavvikelser ett värde befinner sig, antingen positivt eller negativt, från medelvärdet.
39
* Standardiserad normalfördelning * Z-transformation (se bild)
40
Beskriv **korrelation** och vad man ska tänka på i användandet utav korrelation.
**Korrelation** _Mått på samband mellan två variabler._ * Korrelation anger styrkan och riktningen av ett samband mellan två variabler. Det kallas även korrelationskoefficient, eller bivariat analys. * Korrelationen uttrycks som ett värde mellan -1 och +1, där 0 anger inget samband, +1 anger maximalt positivt samband och -1 anger maximalt negativt samband. * r = (±) 0.10 = svag * r = (±) 0.30 = medel * r = (±) 0.50 = stark) * ​Den lämpligaste formen att beräkna korrelation är Pearson's r **(r)**. OBS! Vid icke-linjära samband så ska man inte använda Pearson's r. * Viktigt att komma ihåg! En korrelation säger ingenting om orsakssamband, eller kausalitet. Dvs se upp för mellanliggande resp. bakomliggande variabler.
41
Beskriv Kovarians och hur den skiljer sig från korrelationskoefficienten.
**Kovarians (COV)** * Kovarians är ett mått på samvariation mellan två variabler. * Kan ses som en ostandardiserad korrelationskoefficient. * Medan den vanliga korrelationskoefficienten endast kan anta värden mellan -1 och +1 så kan kovariansen anta vilka värden som helst, beroende på vilka enheter man har i sina mätningar.
42
Ge exempel på 5 vanliga **frekvensfördelningar**.
**Frekvensfördelningar** 1. Normalfördelning - Symetrisk fördelning 2. Rektangulär fördelning - likformig fördelning 3. Bimodal fördelning *(två toppar)* 4. Positiv snedfördelning *(svansen åt höger)* 5. Negativ snedfärdelning *(svansen åt vänster)* *​(Dessa kan även anges aproximativt (ungefärligt) för frekvensfördelning.)*
43
Näm de tre vanligaste **sambandsmåtten** för linjära samband.
**Korrelationskoefficienter, *r*** Alltid mellan -1 och +1! * **Produktmomentkorrelationskoefficienten** * **​**Pearsons koeff. (***rxy***) * Vanligaste korrelationsmåttet! * ​**Rangkorrelationskoefficienten** * **​**Spearmans koeff. (***rs***) * ​φ **koefficienten ** * **​**Phi (***rφ***)
44
Förklara korrelationskoefficienten, **Pearsons koeff.**
**Produktmomentkorrelationskoefficienten** * **Pearsons r** * Kallas ofta ***rxy*** * Vanligaste korrelationsmåttet (det man oftast menar när man talar om korrelation) * Mäter graden av **linjär samvariation** * Beräknas mellan två variabler, X och Y * Observationerna som talpar * Normalfördelad data * Kvotdata, intervalldata, ordinaldata
45
Förklara korrelationskoefficienten, **Spearmans koeff**.
**Rangkorrelationskoefficienten** * Spearmans koeff. * Ofta kallad ***rs*** * Mäter graden av **linjär samvariation** * Ordinaldata * Variablerna rangordnas, sedan används Pearsons r för att beräkna korrelationen mellan rangtalen.
46
Förklara korrelationskoefficienten, Phi (***rφ***)
**φ koefficienten** * Phi φ * Nominaldata * Beräknas på material i fyrfältstabell, där man räknat frekvenser. Ex. Antal JA/NEJ för MAN respektive KVINNA.
47
Hur beräknas korrelationskoefficienten **rxy**?
**Uträkning av korrelationskoefficienten, Pearsons r (rxy)** OBS! Vardera x- och y-värde måste beräknas var för sig (stegen 2-4) innan de kan summeras/delas!!
48
Förklara Regression & Prediktion
**Regression & Prediktion** * Först beräknas korrelationen "r", samband eller ej? * Finns det ett samband så kan den tänkta linjen genom punktsvärmen beräknas. * Den kan betraktas som en rät "medel-linje", där varje punkt på linjen är ett sorts medelvärde. * Den beräknade räta linjen kallas **regressionslinje** * Linjen kan användas för att göra en förutsägelse, en **prediktion. **
49
Regressionsanalys - Hur beräknas en **regressionslinje?**
Regressionsanalys * Den räta linjens ekvation: **ŷ = *b0 *+ *b1 x*** * OBS! Det måste finnas en korrelation för att kunna utföra en regressionsanalys. * ***​***För att räkna ut en regressionslinje måste du ha beräknad medelvärdet, standardavvikelsen och korrelationskoefficienten. * ***b0 ***- Anger var linjen skär y-axeln, start-värdet (**intercept**). * ***b1 ***- Regressionskoefficienten, anger lutningen på linjen, dvs hur många enheter Y ändras när X ändras en enhet (**slope**).
50
Hur utförs en **prediktion**?
**Att predicera** * Om två variabler är starkt korrelerade kan man utnyttja regressionslinjen för att göra en prediktion, en förutsägelse. * Regressionslinjens ekvation: ŷ = *b0* + *b1* x * **Exempel** * **​**Vad är genomsnittliga vikten för en kvinna som är 170cm lång? * Y = vikt (kg), X = längd (cm) * Regressionslinjen: ŷ = -37,72 + 0,5971 x * ŷ = -37,72 + 0,5971 • 170 = 64kg * Det predicerade värdet på y är: ŷ = 64kg * Den genomsnittliga vikten för en kvinna på 170cm är 64kg. * *Förutsatt att stickprovet är representativt för populationen.*
51
Vad är detta för skala? * Värdena kan delas in i grupper/kategorier. * Värdena går inte att rangordna. Variabeln ”Frukt” är t.ex. en ...skala – det finns bananer, päron, äpplen och så vidare. De är olika, men ingen är mer ”frukt” än någon annan. De går inte att rangordna.
Nominalskala
53
Vad är detta för skala? * Värdena kan rangordnas. * Olika el. icke urskiljningsbara avstånd mellan värdena (har ej ekvidistans). Ex: En skala som har alternativen ”Mycket bra” ”Ganska bra” ”Varken bra eller dåligt” och så vidare är en ....skala.
Ordinalskala
55
Vad är detta för skala? * Värdena kan rangordnas. * Det är lika stort avstånd mellan värdena (har ekvidistans) Ex. Meter eller temperatur.
Intervallskala
57
Vad är detta för skala? * Värdena kan rangordnas * Det är lika stort avstång mellan alla värden (har ekvidistans) * Det finns en absolut 0-punkt.
Kvotskala
59
Vad kallas det att skalan har när den har.. * Lika stort avstånd mellan värdena. Ex. centimeter är en sådan skala. 5 cm är mer än 4 cm, och avståndet mellan 5 och 4 cm är lika stort som avståndet mellan 4 och 3 cm.
Skalan har ekvidistans