Icke-parametriska vs. parametriska Flashcards
(4 cards)
Nämn tre förutsättningar som vanligtvis bör vara uppfyllda för att använda parametriska inferenstest. Förklara också kort varför icke-parametriska metoder bör undvikas då förutsättningarna för
parametriska test är uppfyllda. (3p)
- Data bör vara på intervall eller kvotnivå. Inte all data men vanligtvis BV eller både OBV och
BV - Det bör finnas en homogen varians (t.ex. mellan betingelser vid en jämförelse av skillnader)
- Approximativt normalfördelat. Detta kan man nästan alltid utgå från att det är när n > 30 på
grund av centrala gränsvärdessatsen som säger att tillräckligt stora stickprovsfördelningar
kommer att reflektera fördelningen i populationen. Den säger även att en
normalfördelningskurva av upprepade stickprov kommer att reflektera
populationsmedelvärdet, men med mindre varians.
Icke-parametriska test bör undvikas då de har lägre power. Dvs att sannolikheten att hitta en
sann effekt (om en sann effekt finns) blir lägre. Parametriska test har alltså högre power och
bör utföras om man har förutsättningarna.
Icke-parametriska test har fördelen jämfört med parametriska test att de är flexibla och inte ställer
lika rigorösa krav på insamlade data. När kan det ändå vara lämpligt att använda icke-
parametriskt test istället för parametriskt test, och varför är parametriska test att föredra i övrigt?
(3p)
Det är lämpligt att använda sig av icke-parametriska tester när datan inte är normalfördelad
(t.ex. om det finns stora extremvärden som gör att datan är snefördelad/skewed) eller inte har
stor statistisk power (t.ex. om det är få deltagare eller att studiens manipulation inte är
tillräckligt stark). Parametriska tester är att föredra för att vi kan få mycket information från
datan som vi kan undersöka, bl.a. medelvärde och konfidensintervaller. Parametriska test är
alltså mer detaljerade och informationsrika, och de kräver fler deltagare än icke-parametriska
tester. De studier som kräver parametriska tester har också ofta större statistisk power
När kan det vara lämpligt att använda icke-parametriskt test istället för parametriskt test?
Varför är parametriska test att föredra? (3p)
Parametriska test är generellt att föredra då de har högre power. Högre power innebär att
sannolikheten för att begå ett typ II-fel minskar, dvs. att man missar en verklig skillnad.
Parametriska test förutsätter dock följande: att data är på antingen kvot eller intervallskala,
normalfördelning (gäller främst mindre stickprov, på grund av den centrala gränsvärdessatsen,
att fördelningen av stickprovsmedelvärden kommer att närma sig en normalfördelning om
stickprovet är tillräckligt stort, oavsett hur fördelningen i stickprovet ser ut) samt homogen
varians, dvs. liknande varians i olika grupper.
Om dessa krav ej uppfylls är det mer lämpligt att använda sig av ett icke-parametriskt test.
Om man är osäker kan man alltid köra båda testerna och undersöka eventuella skillnader.
Icke-parametriska test har som sagt visserligen lägre power, men de är mindre känsliga för
avvikelser från nomralfördelningen (skewness, kurtosis) och extremvärden.
Ge exempel på två saker att beakta när du ska välja mellan parametriska och icke-parametriska
metoder (2p).
Två saker ha i beaktning när jag väljer mellan parametriska och icke-parametriska metoder är:
1) Skalnivå. För att kunna använda parametriska metoder bör data återfinnas på intervall eller
kvotskala. Det innebär att vi vet hur stort avståndet är mellan mätpunkterna. I parametriska
tester uppskattar man parametrar i en population utifrån ett stickprov och för att kunna göra det
behövs den nämnda skalnivån. Icke-parametriska test rangordnar istället data och kan därav
angripa data på ordinal och kategoriskala.
2) Huruvida data är normalfördelat behöver även det tas i beaktning. Normalfördelning innebär
att det i datan finns skewness =0 och kurtosis =0. För att data ska kunna analyseras med
parametriska metoder behöver data vara normalfördelat. Detta är dock att hårddra det något,
då litteraturen berättar att de parametriska testerna är relativt robusta och kan hantera data
som inte är helt normalfördelat.