Statistik Flashcards
(37 cards)
Parameter
Värde som beskriver populationen
Estimat
Värde som vi mätt eller beräknat från stickprovet
Typvärde
Det vanligaste värdet
Median
Det mittersta värdet
Medelvärde
Det genomsnittliga värdet. Väntevärdesriktigt!
Väntevärdesriktigt
Stickprovsmedelvärdet förväntas motsvara populationsmedelvärdet i det långa loppet
Variationsbredd
Skillnaden mellan det högsta och lägsta värdet
Percentiler & Kvartiler
Värde under vilket en viss andel av fördelningen ligger
Varians & Standardavvikelse
Genomsnittlig variation
Normalfördelningen
Beskrivning av hur data är fördelad. Standardavvikelserna sammanfaller med vissa specifika percentiler
Z-värden
Sätt att skriva om data så att varje värde beskriver hur många standardavvikelser det är från medelvärdet. Standardisering av data, förenklar att jämföra variabler med varandra
Pearsons korrelationskoefficient
Standardiserat mått på samvarians. Påvisar endast linjära korrelationer. Påverkas mycket av extremvärden. Kräver tillräcklig variation i båda variablerna
Spearmans rangkorrelationskoefficient
Baserad på observationers rangordning istället för deras z-värden. Används t.ex. när data är ordinalskala, inte normalfördelad eller vid förekomst av extremväden
Regression
Används för att förutsäga värdet av en variabel baserat på värdet av en annan. Innefattar regressionskoefficient(er) och ett intercept. Viktigt att skilja på beroende och oberoende variabel
Enkel linjär regressionsanalys
y=b0+b1x
b1 anger linjens lutning. b0 säger var linjen skär y-axeln, och kan ses som “basnivå” och b1 som ett mått på hur mycket den beroende variabeln “beror” på den oberoende variabeln
Samplingsfördelningen
Uppskattning av hur mycket stickprov av en viss storlek från en viss population varierar. Variationen i samplingsfördelningen kan uppskattas m h a variationen i vårt stickprov. Ju mindre standardfel, desto närmare befinner sig stickproven populations medelvärde
Standardfelet (SE)
Standardavvikelsen i samplingsfördelningen. Mått på hur mycket våra stickprov varierar
Konfidensintervall
Avgränsar ett intervall inom vilket vi kan vara “ganska säkra” på att populationens medelvärde ligger (Oftast 95%). Om vi skapade 100 KI från samma population skulle ungefär 95 stycken innefatta populationens medelvärde
Nollhypotestestning
Baserat på att beräkna sannolikheten att våra resultat skulle uppstå givet att nollhypotesen gäller. Ett sätt att avgöra om resultaten från ett statistiskt test är rimligt att generalisera till populationen eller inte
T-test
Sätt att avgöra om medelvärdet skiljer sig från ett visst värde. Används ofta för att avgöra om två variabler skiljer sig från varandra. Statistiskt signifikant t-test betyder att observationerna vore osannolika utifall att det egentligen inte finns någon skillnad
Oberoende t-test
Används för att jämföra olika grupper
Beroende t-test
Används för att jämföra olika mätningar inom samma grupp. Slipper en del brus pga individuella variationer och blir därför mer kraftfulla än oberoende t-test
Parametriska test
Förutsätter att data är på antingen intervall- eller kvotskala
Antaganden - Normalfördelning
Många test antar att populationens värden är normalfördelade. Ofta vet vi ej säkert om populationen är normalfördelad, tillräckligt stort stickprov ger ofta en bra uppskattning