Kvant: föreläsningskompendium Flashcards
(34 cards)
Kausala samband
“den som hittar ett samband mellan två variabler, och som sedan antar att sambandet är kausalt, bör försöka tänka ut alla möjliga alternativ som sambandet kan bero på. Det för att sedan försöka falsifiera det påvisade sambandet (det vill säga att försöka bevisa att sambandet egentligen är ett skensamband som beror på en eller fler övriga variabler). Om falsifieringen av ursprungssambandet inte lyckas betyder det inte att det är bevisat att sambandet är kausalt, men i brist på motbevis får vi för tillfället utgå ifrån att så är fallet. Detta är helt analogt med Poppers hypotetisk-deduktiva metod: om en teori inte kan falsifieras blir den till en provisorisk sanning.”
Tvärsnittsundersökningar i relation till tidsordning:
“den vanligaste typen av kvantitativa undersökningar är tvärsnittsundersökningar där data endast insamlas vid ett tillfälle, vilket innebär att man inte har någon information om när i tiden olika saker inträffar. Allt man kan studera är samband mellan variabler. Särskiljandet måste då ske på ett teoretiskt plan. Exempelvis om vi ser ett samband mellan kön och kulturkonsumtion och där utbildning är den tredje variabeln så är det självklart att z inte kan vara en bakomliggande variabel då utbildning inte påverkar en persons kön och det måste istället handla om en mellanliggande variabel; män och kvinnor tenderar att skaffa sig olika utbildningar, och utbildningen påverkar i sin tur konsumtionen.”
Skensamband
“såväl bakom- som mellanliggande variabler kan producera skensamband. Ett skensamband är ett samband som egentligen helt och hållet beror på andra variabler, alltså ett samband som försvinner helt då man kontrollerar för övriga variabler som samvarierar med både dem oberoende och den beroende variabeln.”
Tidsordningen för variablerna:
“om Z är en bakomliggande variabel, och således påverkar både X och Y, måste Z inträffa före X i tiden. Men i fallet där Z är en mellanliggande variabel, måste X inträffa först för att kunna påverka Z som i sin tur måste inträffa före Y för att kunna påverka just Y. “
I de fall där en konstanthållning för en tredje variabel resulterar i att sambandet mellan X och Y försvinner:
“det kan vara så att det ursprungligt uppmätta sambandet helt försvinner när en tredje variabel inkluderas i analysen, men det kan också vara så att sambandet mellan X och Y finns kvar, men ändrar styrka. I de fall då sambandet mellan X och Y helt försvinner vid konstanthållning för en tredje variabel säger man att sambandet är ett skensamband, alternativt ett spuriöst samband.”
Mellanliggande variabel:
“den oberoende variabeln påverkar en tredje variabel som i sin tur påverkar den beroende variabeln. Alltså en variabel som dyker upp mellan den oberoende och den beroende variabeln. “
Bakomliggande variabel:
“det finns en tredje variabel som påverkar de två undersökta variablerna. Alltså en variabel som ligger bakom både den oberoende variabeln och den beroende variabeln).”
Mellan- och bakomliggande variabler:
“en samvariation mellan två variabler ska inte misstolkas som ett kausalt samband dem emellan utan när en samvariation mellan variabler hittas bör man ställa sig frågan vad denna samvariation beror på. Man bör fråga sig om det verkligen handlar om ett direkt samband?”
Konstanthållning av en tredje variabel:
“inom samhällsvetenskapen är det relativt enkelt att påvisa statistisk samvariation men betydligt mer komplext att påvisa kausalitet, men med hjälp av teori och konstanthållning kan man ändå komma en viss bit på vägen genom att rensa bort effekter som beror på andra variabler. Konstanthållning betyder således att vi förutom X och Y även inför en tredje variabel i analysen som kallas för Z. Detta innebär också att de analyser vi gör kommer att gå från att vara bivariata (innehålla två variabler) till att bli multivariata (innehålla fler än två variabler). De analyser vi kommer att göra underlättas även väldigt mycket om den tredje variabeln (Z, alltså den variabel som vi konstanthåller för) är dikotomiserad (tudelad). Det bör dock noteras att det inte är något krav att den variabel som används för konstanthållning är dikotomiserad.”
Om p-värdet är lika med 0.000
“betyder det inte att vi är 100% säkra på att sambandet även finns i populationen, men vi kan vara mer än 99,9% säkra på det. Detta då vi vid urvalsundersökningar aldrig kan vara 100% säkra på något, och ett p-värde har alltid en siffra någonstans i raden av decimaltal. “
Statistisk signifikans och p-värdet:
“när det gäller statistisk signifikans refereras ofta till så kallade p-värden. Det är värden som anger hur troligt det är att det uppmätta sambandet egentligen inte existerar i populationen som helhet. Om vi tillåter oss vara lite slarviga kan vi säga att p < 0.05 innebär att säkerheten att det uppmätta sambandet inte existerar i populationen som helhet är under 5%, vi kan således vara minst 95% säkra på att sambandet finns (detta naturligtvis under förutsättning att datainsamlingen gått till enligt konstens alla regler).”
95% konfidensintervall:
“Det man i praktiken räknar ut när man räknar på om en korrelationskoefficient är statistiskt signifikant är sannolikheten att korrelationskoefficienten egentligen, i populationen, är lika med 0. Om den sannolikheten är mindre än 5% säger man sig vara 95% säker på att korrelationen är statistiskt signifikant. Att en korrelationskoefficient på exempelvis 0.32 är statistiskt signifikant innebär med andra ord inte att vi är 95% säkra på att korrelationskoefficienten verkligen är 0.32 utan det innebär att vi är 95% säkra på att korrelationskoefficienten är större än 0, och att det alltså finns ett samband mellan de studerade variablerna även i populationen (och inte endast i urvalet).”
Statistisk signifikans:
“eftersom de flesta undersökningar görs på urval från en population, och inte på hela populationen är de siffror (medelvärden, sambandsmått, etc.) som undersöks inte identiska med de sanna populationsvärdet. Det finns med andra ord en viss risk att en framräknad korrelation beror på slumpmässiga fel i det insamlade datamaterialet, och att korrelationen alltså inte finns om man ser till hela populationen. Man kan dock räkna på sannolikheten att den framräknade korrelationen faktiskt finns i hela populationen, och om man kommer fram till att det är 95% säkert att det faktiskt finns en korrelation mellan X och Y i hela populationen, så säger man att korrelationen är statistiskt signifikant (95% är den absolut vanligaste gränsen man använder sig av för att konstatera om ett värde är statistiskt signifikant eller ej).”
Kontextens betydelse för korrelationskoefficienten:
“tolkningen av korrelationskoefficienter är kontextberoende. Man måste ta hänsyn till vad som studeras när korrelationskoefficienter tolkas. När man studerar saker som är svårmätbara (exempelvis psykiskt välbefinnande, stress etc.) bör man förvänta sig lägre korrelationskofficienter än när man undersöker fenomen som är relativt lätta att mäta (exempelvis olika typer av demografisk data).”
Skalnivåer och dess betydelse för sambandsriktning:
“Notera också att frågan om sambandsriktningar endast är relevant då man har variabler på lägst ordinalskalenivå (variablerna måste med andra ord kunna rangordnas). Om variablerna (den ena eller båda) är på nominalskalenivå finns det ingen naturlig rangordning, och begrepp som ökar/ minskar eller högt/lågt är inte meningsfulla. Istället är det ännu viktigare än annars att beskriva sambandet i ord: män tjänar i genomsnitt mer än kvinnor, de som bor i städer tenderar att gå oftare på bio och museum än de som bor på landsbygden). “
Värdena mellan 0 och 1 på korrelationskoefficienten:
“anger olika stark grad av korrelation.”
Om korrelationen är 1 (eller -1):
“råder ett perfekt (deterministiskt) samband mellan variablerna.”
Om korrelationen är 0:
“betyder det att det inte finns någon samvariation alls mellan variablerna, sambandet är ett så kallat nollsamband.”
Vad anger korrelationskoefficienten:
“korrelationskofficienten varierar mellan -1 och (+)1 och anger två saker; styrkan på sambandet (som varierar mellan 0 och 1) samt sambandets riktning (positivt eller negativt).”
Korrelationskoefficient:
“när vi mäter hur två variabler samvarierar räknar vi fram en korrelationskoefficient. Det finns många olika sätt att beräkna korrelationskoefficienten, eller korrelationen på. Vilken metod som är lämpligast beror bland annat på vilken skalnivå variablerna tillhör. “
Olika korrelationskoefficienter:
- Pearsons r
- Spearmans rho (p)
- Phi-koefficienten
Korrelationskoefficient: Pearsons r
Pearsons r / produktmomentkorrelationskoefficient: kan man räkna för variabler på kvot- och intervallnivå.
Korrelationskoefficient: Spearmans rho (p)
Spearmans rho (p) / spearmans rangkorrelation: gäller för data på ordinalskalenivå.
Korrelationskoefficient: Phi-koefficienten
Phi-koefficienten: används för data på nominalskalenivå.