Uppdaterad Flashcards
(95 cards)
3 steg i den statistiska analysen
- Lär känna datan
- Sammanfatta datan
- Bekräfta vad datan stödjer/avslöjar
Lär känna datan
Fastställa om datan är meningsfull
Undersöka outliers och errors
Sammanfatta datan
Sätta enkla siffror på våra datapunkter
Bekräfta vad datan stödjer/avslöjar
Hypotespröva
Genom SPSS
Stem-and-leaf-diagram
Stam - tiotal
Blad - ental
För att lättare se fördelningen av datan
Bimodal distribution
2 värden i datan är vanligast och sticker ut
T.ex Kroppslängd för män och kvinnor, män tenderar att vara längre så en topp för män och en topp för kvinnor
Outliers
Extremvärden
Värden som ligger långt ut och skiljer sig från resterande värden
Variabilitet
Hur mycket värden i en datamängd skiljer sig från varandra
Hur utspridd eller koncentrerad observationen/värdena är kring medelvärdet
Boxplot
Grafiskt sätt att få en bild över datan, speciellt vid hög variabilitet
Hur utformar sig en boxplot?
- Medianen sträcket i mitten av lådan
- Lådan innehåller 50% av datan
- Strecken visar spridningen av datapunkterna
Boxplotdefinitionen
Värden utanför intervallet sållas bort som extremvärden
Kvartiler
Delar in datan i 4 lika stora delar för att bättre förstå spridningen av datan och hitta mitten
Q2
Medianen - mitten värdet betyder att hälften (50%) av datan är mindre
Q1
Medianen av den undre halvan - 25% av värdena är mindre än denna medianen
Q3
Medianen av den övre halvan - 75% av värdena är mindre än denna medianen
IQR (Interquartile Range)
Skillanden mellan Q1 och Q3
Förklarar spridningen av Q2
Vad används IQR till?
Hitta extremvärden
Beskriva variationen i datan
Central tendency
Ett centralt värde som sammanfattar datamängden
Vanligaste central tendency
Medelvärde - summan av alla värden dividerat med antalet värden
Median- Värdet när datan är placerad i storleksordning
Typvärde - De värde som förekommer flest gånger i datamängden
När är medelvärdet bra att använda?
Datan är jämn
Vill veta ett sammanfattat värde
t.ex genomsnittsbetyg i en klass där alla ligger ganska nära varandra
När är det bar att använda median?
När extremvärden finns
Datan är snedfördelad (ojämn)
När är det bar att använda typvärde?
När man vill veta vilket värde som är vanligast
När datan är kategorisk
t.ex vilken sport är populärast
Intervall (Range)
Visar skillnaden mellan största och minsta värdet i en datamängd
största - minsta
Mått på hur utspridda värdena i datamängden är
Standardavvikelse (SD, s)
Visar i genomsnitt hur mycket varje datapunkt tillsammans avviker från medelvärdet
Blir i samma enhet som de andra värdena medans variansen inte är det.