Statistik 1 Flashcards
(25 cards)
Vad menar vi med “tvärsnittsstudier” inom Statistik-området, när blir det relevant?
“Tvärsnitt” inom statistik området har vi om vi har två olika grupper och vill göra oberoende t-test mellan dem, dvs. beroende variabel är metrisk emedan oberoende är binär.
Vad används ofta inom självskattningstester? Passande lägesmått?
Självskattningstester: ordinal- eller rangskala. Det är flytande vilka intervall som finns.
Ge synonym till rang-skala.
Rangskala är samma sak som ordinalskala.
Vilka skaltyper är kvalitativa vs. kvantitativa? Vilka egenskaper har dessa?
Kvalitativa = kategoriska
- nominal (namn)
- ordinal/rang (namn + ordning)
Kvantitativa = numeriska/metriska (diskreta/kontinuerliga)
- Intervall (namn + ordning + proportionella intervall)
- Kvot (namn + ordning + proportionella intervall + NOLL-9!)
Vad är en dikotom variabel?
En dikotom variabel är en binär variabel, dvs. en kvalitativ nominal kategorisk variabel med endast två alternativ: t.ex. har mutation vs. har inte mutation.
Vilka skaltyper är det relevant att avgöra om de är diskreta vs. kontinuerliga?
Kvantitativa/metriska/numeriska variabler är antingen diskreta eller kontinuerliga.
Statistik är antingen parametrisk eller icke-parametrisk. Vid vilken typ är typvärde relevant?
Typvärde är relevant vid icke-parametrisk statistik, och innebär DET MEST FÖREKOMMANDE VÄRDET.
Vilken typ av statistik, parametrisk eller icke-parametrisk, är relevant om vi har många outliers?
Outliers indikerar att SD inte är ett bra mått, vilket lämpar sig för ICKE-PARAMETRISK statistik.
Medelvärde +/- sd av vitamin D-halt inom en grupp presenteras som 5 +/- 4. Vad kan vi säga om detta?
Vitamin D är, liksom många andra biomarkörer, INTE NORMALFÖRDELAD. Detta indikeras av att redan vid medelvärdet +/- 2*sd, så har vi negativa halter vitamin D.
När indikeras att jämföra medelvärde +/- 2 SD?
Om vi anar att något inte är normalfördelat kan vi undersöka SD i förhållande till medelvärdet (om vi har NOLLPUNKT! Dvs. om vi har KVOTSKALA!).
Ex. kolesterol är 3 +/- 2, vilket ger negativa kolesterolhalter redan efter 2 SD!
Vad indikeras av stora standardavvikelser?
Stora SD i förhållande till medelvärde, indikerar att det INTE är normalfördelat, vilket kan göra att vi ANAR OUTLIERS!
När är omkodning relevant?
Omkodning kan användas för att göra något normalfördelat.
Förutom symmetri och liten spridning, vilket är ett till rimligt krav att ställa på en fördelning fö ratt den ska vara normalfördelad?
Kontinuitet, symmetri och liten varians är rimligt i en normalfördelning.
Vid vilken typ av statistik är det FÖRBJUDET att används SD egentligen?
Icke-parametrisk statistik, dvs. när vi använder RANG.
Vid vilken typ av statistik presenteras data gärna i tabeller resp. boxplot?
Tabeller: parametrisk statistik!
Boxplot: icke-parametrisk statistik!
Hur förhåller sig SD och variansen?
SD = kvadrat av varians!
Vilka spridningsmått är lämpliga för
- symmetriska data?
- asymmetriska data?
- ordinal data?
- nominal data?
- Symmetriska data - varians eller SD
- Asymmetriska - kvartiler och percentiler
- Ordnial data - percentiler
- Nominal data - svar saknas
Vilka typvärden är lämpliga för:
- symmetriska data?
- asymmetriska data?
- ordinal data?
- nominal data?
- symmetriska data - medelvärde (SD/varians)
- asymmetriska data - median (percentiler/kvartiler)
- ordinal data - median (medelvärde) (percentiler)
- nominal data - (typvärde) (spridningsmått saknas)
Vid vilken typ av kategorisk variabel är det rätt att använda endast percentiler som spridningsmått?
Ordinal data har endast percentiler som spridningsmått.
Vid vilken typ av variabel har vi percentiler och kvartiler som psridningsmått?
Asymmetriska kvantitativa data använder percentiler OCH kvartiler som spridningsmått.
Vilken typ av variabler kan vi använda medelvärde, SD och varians för?
Endast symmetriska och kvantitativa/numeriska/metriska data har SD, medelvärde och varians! Asymmetriska använder median, percentiler och kvartiler!
Vid vilken typ av data är typvärdet ett bra lägesmått?
Vid nominal data är typvärdet ett bra lägesmått.
Vad representerar lådkanterna i boxplot?
Övre och undre kvartilerna, Q1 och Q3.
Vilka värden är outliers?
Värden utanför 1,5 kvartilavstånd från lådkanten är outliers.