Statistik Flashcards by Ehsan Ghorbani

Parameter

Värde som beskriver populationen

How well did you know this?

Not at all

Perfectly

Estimat

Värde som vi mätt eller beräknat från stickprovet

How well did you know this?

Not at all

Perfectly

Typvärde

Det vanligaste värdet

How well did you know this?

Not at all

Perfectly

Median

Det mittersta värdet

How well did you know this?

Not at all

Perfectly

Medelvärde

Det genomsnittliga värdet. Väntevärdesriktigt!

How well did you know this?

Not at all

Perfectly

Väntevärdesriktigt

Stickprovsmedelvärdet förväntas motsvara populationsmedelvärdet i det långa loppet

How well did you know this?

Not at all

Perfectly

Variationsbredd

Skillnaden mellan det högsta och lägsta värdet

How well did you know this?

Not at all

Perfectly

Percentiler & Kvartiler

Värde under vilket en viss andel av fördelningen ligger

How well did you know this?

Not at all

Perfectly

Varians & Standardavvikelse

Genomsnittlig variation

How well did you know this?

Not at all

Perfectly

Normalfördelningen

Beskrivning av hur data är fördelad. Standardavvikelserna sammanfaller med vissa specifika percentiler

How well did you know this?

Not at all

Perfectly

Z-värden

Sätt att skriva om data så att varje värde beskriver hur många standardavvikelser det är från medelvärdet. Standardisering av data, förenklar att jämföra variabler med varandra

How well did you know this?

Not at all

Perfectly

Pearsons korrelationskoefficient

Standardiserat mått på samvarians. Påvisar endast linjära korrelationer. Påverkas mycket av extremvärden. Kräver tillräcklig variation i båda variablerna

How well did you know this?

Not at all

Perfectly

Spearmans rangkorrelationskoefficient

Baserad på observationers rangordning istället för deras z-värden. Används t.ex. när data är ordinalskala, inte normalfördelad eller vid förekomst av extremväden

How well did you know this?

Not at all

Perfectly

Regression

Används för att förutsäga värdet av en variabel baserat på värdet av en annan. Innefattar regressionskoefficient(er) och ett intercept. Viktigt att skilja på beroende och oberoende variabel

How well did you know this?

Not at all

Perfectly

Enkel linjär regressionsanalys

y=b0+b1x
b1 anger linjens lutning. b0 säger var linjen skär y-axeln, och kan ses som “basnivå” och b1 som ett mått på hur mycket den beroende variabeln “beror” på den oberoende variabeln

How well did you know this?

Not at all

Perfectly

Samplingsfördelningen

Study These Flashcards

Uppskattning av hur mycket stickprov av en viss storlek från en viss population varierar. Variationen i samplingsfördelningen kan uppskattas m h a variationen i vårt stickprov. Ju mindre standardfel, desto närmare befinner sig stickproven populations medelvärde

Standardfelet (SE)

Study These Flashcards

Standardavvikelsen i samplingsfördelningen. Mått på hur mycket våra stickprov varierar

Konfidensintervall

Study These Flashcards

Avgränsar ett intervall inom vilket vi kan vara “ganska säkra” på att populationens medelvärde ligger (Oftast 95%). Om vi skapade 100 KI från samma population skulle ungefär 95 stycken innefatta populationens medelvärde

Nollhypotestestning

Study These Flashcards

Baserat på att beräkna sannolikheten att våra resultat skulle uppstå givet att nollhypotesen gäller. Ett sätt att avgöra om resultaten från ett statistiskt test är rimligt att generalisera till populationen eller inte

T-test

Study These Flashcards

Sätt att avgöra om medelvärdet skiljer sig från ett visst värde. Används ofta för att avgöra om två variabler skiljer sig från varandra. Statistiskt signifikant t-test betyder att observationerna vore osannolika utifall att det egentligen inte finns någon skillnad

Oberoende t-test

Study These Flashcards

Används för att jämföra olika grupper

Beroende t-test

Study These Flashcards

Används för att jämföra olika mätningar inom samma grupp. Slipper en del brus pga individuella variationer och blir därför mer kraftfulla än oberoende t-test

Parametriska test

Study These Flashcards

Förutsätter att data är på antingen intervall- eller kvotskala

Antaganden - Normalfördelning

Study These Flashcards

Många test antar att populationens värden är normalfördelade. Ofta vet vi ej säkert om populationen är normalfördelad, tillräckligt stort stickprov ger ofta en bra uppskattning

Antaganden - Homogen populationsvarians

Värden i alla de variabler man jämför varierar lika mycket. Tumregel att variansen får vara max tre gånger så stor

Icke-parametriska test

Går ut på att räkna på datavärdenas inbördes rank. Pga detta går det att använda icke-parametriska test när data inte uppfyller kraven på intervall-/kvotskala, normalfördelning och homogen varians

Effektstorlek

Standardiserade mått på effekters storlek. Användbart då man har variabler vars tolkning inte är uppenbar. Som effektstorlek för skillnader kan vi använda Cohens d. För oberoende mätningar baseras s på den "poolade variansen"

Statistisk power

Power kan tolkas som sannolikheten att få ett statistiskt signifikant resultat givet att nollhypotesen är falsk. Alfanivån, faktiska effektstorleken, stickprovets storlek, sd i populationen, och experimentell design påverkar power

Powerberäkningar

Ta reda på hur stort stickprov man behöver för att nå en viss power. Använder sig av hjälpvariabeln delta.

Extremvärden

Kan ofta ha en oproportionerligt stor påverkan på statistiska test. Vanlig tumregel: tre sd från medelvärdet. Möjliga lösningar - Ta bort värdena. Använda icke-parametriska test

Massignifikans

Viss sannolikhet att typ-I fel är inbyggd i nollhypotestestning. Utför man många tester i samma undersökning blir sannolikheten för Typ-I fel högre. Kan kompenseras med bonferronikorrigering (proportionerligt sänka alfanivån)

Små stickprov

Bara väldigt stora effekter blir statistiskt signifikanta. Kan leda till överskattning av effektstorlek

Stora stickprov

Även väldigt små effekter blir statistiskt signifikanta. Innebär att man måste vara noga med att kontrollera praktisk signifikans

Ensidig prövning

Vi vill veta om det finns en effekt i en viss riktning. Finns positivt/inte positivt samband mellan studietid och tentaresultat

Tvåsidig prövning

Vi vill veta om det finns en effekt eller inte. Finns samband/inget samband mellan studietid och tentaresultat

Typ I-fel

Att förkasta nollhypotesen trots att den gäller. Sannolikheten är lika med alfanivån. Sänkning av alfanivån gör typ I-fel mindre sannolika men Typ-II fel mer sannolika

Typ II-fel

Att behålla nollhypotesen trots att alternativhypotesen gäller. Sannolikheten påverkas av stickprovsstorlek, effektstorlek, felvarians och beroende mätningar

Statistik Flashcards

(37 cards)