Faktoranalys Flashcards
(13 cards)
Vad är faktoranalys
En metod för att identifiera underliggande samband mellan många observerbara variabler. Man reducerar datan genom att identifiera ett mindre antal latenta faktorer som kan förklara mönster i de observerbara (manifesta) variablerna.
Vi minskar alltså antalet variabler genom att kombinera dem till faktorer. 3 syften:
* Gör det enklare att tolka och analysera data
* vi kan identifiera underliggande strukturer
* vi kan mäta latenta variabler
Kan användas för att ta fram ett test av ngt slag
2 typer av faktoranalys
Explorativ
När vi inte har några förväntningar om vilka faktorer som finns. Utforskar datamönster och försöker hitta de faktorer som bäst förklarar variationerna i de observerbara variablerna. Man gör detta som steg 1 för att få en faktorlösning
Konfirmatorisk
När vi har en hypotes om vilka faktorer som finns och hur de är kopplade till faktorerna. Syftet med faktoranalysen är då att testa och bekräfta denna hypotes. Vi gör detta i steg 2 för att bekräfta faktorstrukturen
Construct validity
Hur väl mäter ett test det teoretiska begrepp/konstrukt som vi vill mäta?
Hur väl representerar operationaliserade variabler det underliggande begreppet?
En del av detta handlar om faktorstruktur dvs hur väl olika items grupperar sig kring faktorer. Detta kan vi mäta med faktoranalys
Stegen i en faktoranalys
- Välj vilka variabler som ska inkluderas i analysen
- Beräkna korrelationer mellan alla variabler
- Extrahera faktorer. Identifiera antal faktorer/struktur som bäst förklarar korrelationsmönstret
- Faktorrotation
- Tolka och namnge faktorer
Faktorlösning
Resultatet av en faktoranalys. Vi har identifierat de underliggande faktorerna.
Information vi har:
* Hur många faktorer har vi extraherat från datan
* Faktorladdningar - hur starkt är varje variabel associerad med varje faktor
* Faktorrotation
* Varians
Faktorladdning
Hur starkt är varje variabel relaterad till en faktor? En hög faktorladdning indikerar en stark relation till just den faktorn.
Eigenvalues
Hur mycket av variansen i variablerna förklaras av en specifik faktor?
Man utgår från detta när man bestämmer hur många faktorer som ska extraheras.
Varje faktor får ett eigenvalue som representerar den mängd varians som förklaras av faktorn.
Ett högt eigenvalue innebär att faktorn förklarar en större del av variansen i de observerade variablerna.
Behåll bara faktorer med eigenvalue > 1
Maximum likelihood
ML bygger på sannolikhetslära och används för att estimera faktorladdningar.
Detta möjliggör hypotesprövning och konfidensintervall.
Man får även mått på modellens passform (model fit)
Dubbelladdningar
När en variabel har höga laddningar på mer än 1 faktor. Den tillhör inte tydligt en faktor.
Detta gör det svårt att tolka resultatet av faktoranalysen, eftersom det innebär att variabeln kanske mäter flera underliggande dimensioner samtidigt. Eller att det finns överlappande faktorer som inte är bra separerade.
Gränsen brukar ligga runt 0.4
Lösningar:
* faktorrotation kan minska dubbelladdningarna
* ompröva antalet faktorer
* ta bort de dubbelladdade variablerna från analysen
Hur bestämmer vi hur många faktorer som ska behållas?
Eigenvalues
Faktorer som ska behållas bör ha Eigenvalue > 1
Undersökning av plot/graf
Där plotten “bryts” ska inte fler faktorer tas med
Parallell analys
Kör datan i flera omgångar för att se om samma antal faktorer faller ut
Scree plot
En graf som används för att bestämma antalet faktorer som ska behållas i analysen. I den kan man se eigenvalues för varje faktor, ordnat från största till minsta värde.
På y-axeln har vi eigenvalues, på x-axeln antal faktorer.
I grafen letar man efter “knäet” vilket är punkten där kurvan börjar plana ut. Faktorerna innan knät är viktiga och ska behållas i analysen, övriga kan ignoreras.
Model fit
Hur väl stämmer den föreslagna faktormodellen överens med den observerade datan?
bra model fit = modellen lyckas förklara mönster i datan på ett adekvat sätt. Dvs att modellen är meningsfull och användbar i att förklara underliggande strukturer i data
bra model fit = högre validitet, att modellen mäter det den avser mäta
vi kan mäta model fit m Chi-2 test
faktorrotation
En teknik för att göra faktorerna mer lättolkade. Man omvandlar faktorladdningar för att få varje faktor att ligga högt på bara en faktor, och lågt på de andra. Detta utan att ändra på den underliggande faktorstrukturen.
Efter rotationen blir mönstret ofta tydligare, så att man lättare kan identifiera vilka variabler som hör till vilka faktorer. Det blir då också lättare att identifiera, tolka och namnge själva faktorerna.
Ortogonal rotation
Faktorerna hålls okorrelerade. Ex varimax. Maximera variansen av faktorladdningar inom varje faktor.
Sned rotation
Faktorerna tillåts vara korrelerade med varandra. Ex promax eller oblimin.