Faktorenanalyse Flashcards

1
Q

Was ist die Grundidee der Faktorenanalyse?

A
  • Korrelationen zwischen (manifesten) Items werden dadurch erklärt, dass ihnen ein gemeinsames latentes Merkmal (=Faktor) zugrunde liegt
  • paarweise Korrelationen trotz Faktor <1 -> neben latenten Merkmal auch andere Faktoren (wie Messfehler) berücksichtigt

2 Arten: konfirmatorische und explorative Faktorenanalyse

  • Zusammenhang mehrer Items mit einem (hypothetischen) latenten Konstrukt (=Faktor)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wie lautet die Formel für das Generalfaktormodell der Faktorenanalyse?

A

Zᵢ=λᵢ,₁F₁+ δᵢΔᵢ -> ein Faktor

Zᵢ… standardisiertes Ergebnis des Item i
λᵢ,₁… Ladung (=Bedeutung) von Faktor 1 bei Item i
F1… Faktor 1
δᵢ… Ladung (=Bedeutung) aller anderen Einflüsse bei Item 1
Δᵢ… alle anderen Einflüsse (=itemspezifischer Faktor)
= bei jedem Item anders

-> Ähnlich dem Modell der einfachen Regression

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was besagt das multiple Faktorenmodell von Thurnstone?

A

Zᵢ=λᵢ,₁* F₁+ λᵢ,₂F₂ + … λᵢ,ₘFₘ + δᵢ*Δᵢ

Zᵢ=Σλᵢ,ₕFₕ+δᵢΔᵢ

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist die Annahme unkorrelierter Faktoren?

A

verschiedene Faktoren korrelieren nicht miteinander

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was sind die drei wichtigsten Kennwerte der Faktorenanalyse?

A

λᵢ,ₐ = die Ladungen der Faktoren
hᵢ² = die Kommunalität des Items
Eig(Fᵢ) der Eigenwert des Faktors

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was besagen die Ladungen in der Faktorenanalyse?

A

λᵢ,ₐ ist die Korrelation von Item i mit Faktor a
λᵢ,ₐ=ρ(Xᵢ,Fₐ) -> können positiv und negativ sein

λᵢ,ₐ kann als (Konstrukt)Validität des Items i für Faktor a interpretiert werden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist das Bestimmtheitsmaß?

A

Das Bestimmtheitsmaß ist die quadrierte Ladung
λᵢ,ₐ²
besagt wie stark ein Faktor an einem Item beteiligt ist und wie gut die Ausprägung des Faktors durch das Item vorhersagbar ist/wie reliabel es Faktor misst

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was besagt die Kommunalität eines Items?

A

Varianzanteil eines Items der durch alle k extrahierten Faktoren erklärt werden kann
hᵢ²=Σλᵢ,ₐ²

unter Annahme dass die Faktoren stabil sind ist die Kommunalität die untere Schranke der Reliabilität des Items
hᵢ²≤rel(Xᵢ)

Kommunalität liegt zwischen 0 und 1
0-> Item kann garnicht durch Faktor erklärt werden
1 -> Item kann vollständig durch Faktor erklärt werden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist der Eigenwert eines Faktors und wofür ist der gut?

A

wie viel Varianz der jeweilige Faktor von der Gesamtvarianz aller Items erklärt
Eig(Fₐ) = Λ = Σλᵢ,ₐ²

wichtig um Stellenwert eines Faktors zu interpretieren
kann als Maß dafür verstanden werden wie gut der Test die Faktoren misst bzw wie viel Infos die Items über den Faktor liefern

  • Kenngröße für die Anzahl zugrunde liegender Faktoren

Eigenwert Λₐ eines Faktors a = Anteil der Varianz den der a-te Faktor an alle Items i hinweg

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie kann man den Prozentsatz der Gesamtvarianz aller Items berechnen der durch einen bestimmten Faktor erklärt wird?

A

j = Eig(Fₐ)/k100 = Σλᵢ,ₐ²/k100

k… Anzahl an Items im Test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie kann man den Prozentsatz berechnen, den ein bestimmter Faktor von einer durch mehrere Faktoren erklärbare Varianz ausmacht?

A

j = Eig(Fₐ)/ΣEig(Fᵢ)*100
Eigenwert durch Summe aller Eigenwerte mal hundert
-> je größer desto größer sein Anteil an der “Erklärung” der Korrelation zwischen der Items

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist die Parameterschätzung?

A
  • Bestimmung der (unbekannten) Ladungen
  • Festlegung der Faktorenzahl

Grundidee: zunächst wird der Faktor mit dem größten Eigenwert “extrahiert”
-> Summe der quadrierten verbleibenden Korrelationen wird minimiert
-> ΣₐΣₑ[Xₐ, Xₑ]-

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist die Parameterschätzung?

A
  • Bestimmung der (unbekannten) Ladungen
  • Festlegung der Faktorenzahl
  • Lösungsweg aufwendig

Grundidee: zunächst wird der Faktor mit dem größten Eigenwert “extrahiert”
-> Summe der quadrierten verbleibenden Korrelationen wird minimiert
-> ΣₐΣₑ[r(Xₐ, Xₑ)-^λₐ,₁^λₑ,₁]=Minimum
dann zweiter Faktor nach selber Grundidee, allerdings mit den Restkorrelationen
r(Xₐ, Xₑ)Rest=r(Xₐ, Xₑ)-^λₐ,₁
^λₑ,₁
r = Restkorrelation von Item a und b nach Extraktion von Faktor 1

unterschiedliche Schätzmethoden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Welche Extraktionsverfahren kennen wir und wozu werden sie verwendet?

A
  • extraktion der Faktoren aus Daten
    2 häufigste Verfahren:
  • Hauptachsenanalyse (principal axis)
  • Kauptkomponentenanalyse (principal components)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Welche Extraktionsverfahren kennen wir und wozu werden sie verwendet?

A
  • extraktion der Faktoren aus Daten
    2 häufigste Verfahren:
  • Hauptachsenanalyse (principal axis)
    -> auf einen Faktor ladende Items zusammenfassen
  • Kauptkomponentenanalyse (principal components)
    -> Ursachen für hohe Korrelationen zwischen Items
    finden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was passiert bei der Hauptkomponentenanalyse? Principal Component Analysis (PCA)

A
  • Annahme: Varianz wird vollständig durch gemeinsamen Faktor erklärt
  • alle Kommunalitäten (auch die Korrelationen eines Items mit sich selbst) = 1
    –> es werden so viele Faktoren extrahiert wie es Items gibt
  • weder statistische Annahmen getroffen noch Faktoren extrahiert

verwendet Kompositscores “Hauptkomponenten”: soll interindividuelle Unterschiede optimal abbilden
im Prinzip können für p Itemvariablen stets p Hauptkomponenten gebildet werden aber Bedeutung der Hauptkomponenten nimmt sukzessive ab

wesentliches: Eigenwerte, Eigenwertvektoren

-> darf NICHT wie EFA behandelt werden, zB darf keine Faktorenrotation durchgeführt werden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was passiert bei der Hauptachsenanalyse?
Principal Factor Analysis (PFA)

A

Annahme: Varianz=Kommunalität+Einzelrestvarianz
- alle Kommunalitäten (auch die Korrelationen eines Items mit sich selbst) < 1
- Ziel: nur durch gemeinsame Faktoren erklärbare Varianz beschreiben
- Kommunalitätenproblem: Kommunalitäten zu Beginn der Datenanalyse nicht bekannt
–> Faktoren werden zuerst mittels Hauptkomponentenanalyse geschätzt und iterativ verbessert = Kommunalitäteniteration

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Welche Kriterien gibt es bei der Bestimmung der Faktorenzahl?

A
  1. Faktorenzahl wird a priori festgelegt
  2. alle Restkorrelationen sind nahe 0 (z.B.:<.2)
  3. Kaiser Kriterium: Eigenwert des zuletzt extrahierten
    Faktors < 1 -> (Infos über Faktor < Infos über
    einzelne Items)
  4. Elbow Kriterium: Verlauf des Eigenwertediagramms
    (Screeplot)
  5. Parallelanalyse

keine generellen Vorschriften, Grad der Subjektivität ist relativ hoch

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was ist das Elbow Kriterium?

A

Eigenwertetabelle
jene Stelle wird gesucht, an der Verlauf abflacht
-> Faktoren vor dem Knick werden berücksichtigt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Was passiert bei der Parallelanalyse in der Faktorenanalyse?

A
  • es werden 100 Datensätze von Zufallszahlen erzeugt
  • Anzahl Items & Stichprobenumfang enspricht empirisch gewonnenem Datensatz
    -> Faktorenanalyse -> Eigenwerte pro Faktor gemittelt
    –> relevante, nichttriviale Faktoren sind jene, deren Eigenwerte über jeden der gemittelten Parallelanalyse liegen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Wie können Faktoren inhaltlich interpretiert werden?

A
  • Ladungsmatrix bietet Grundlage
  • in einem Faktor hohe Items (λ>0.7) und in allen anderen Faktoren niedrig(λ<0.3) ladende Items = Marker-Items
    -> auf Funktion wären Marker Items nahe an den Koordinatenachsen
21
Q

Was ist die Faktorenrotation und warum wird sie durchgeführt?

A
  • hohe Ladungen bei Erstlösung der Faktoren eher selten, -> Faktorladungsmatrix meist nicht eindeutig bestimmt wenn mehr als ein Faktor extrahiert wird
  • Faktoren werden zur besseren interpretierbarkeit rotiert
    -Ziel: Einfachstruktur Ideal: jedes Item hat nur in einem Faktor hohe und in anderem Faktor niedrige Ladungen
22
Q

Was verändert sich bei der Faktorenrotation und was bleibt gleich?

A

es ändern sich:
- Ladungen
- Eigenwerte
- mögl. Interpretation der Faktoren

unverändert bleiben:
- Kommunalitäten
- Anteil der durch die Faktoren erklärbare Varianz

23
Q

Wann spricht man von einer orthogonalen Rotation?

A

wenn der rechte Winkel zwischen den Faktorenachsen beibehalten wird
= Faktoren bleiben auch nach der Rotation unkorreliert

24
Q

Wann spricht man von einer schiefwinkeligen (oblique) Rotation?

A

wenn die Faktorenachsen nicht im rechten Winkel aufeinander stehen
-> Gibt Forderung nach unabhängigen Faktoren auf

25
Q

Wann spricht man von einer Varimax Rotation?

A

Die Faktoren werden so rotiert, dass die Varianz der Ladungen innerhalb eines Faktors maximal wird
Ziel: pro Faktor sowohl hohe als auch niedrige Ladungen zu haben, um Faktoren leichter benennen zu können

26
Q

Was sind Faktorwerte (auch Skalenwerte)?

A

Kennwerte für die Ausprägung der Personen in den zu Grunde liegenden Faktoren zu ermitteln

Angabe welche Werte die Testperson in jedem extrahierten und rotierten Faktor η hat

Problem: undeterminiertheit der Faktoren

27
Q

Wie wird ein ungewichteter Faktorwert gebildet?

A

pro Person: aufsummieren oder mitteln der Punkte jener Items, die auf Faktor laden -> unterschiedliche Konstruktvalidität wird nicht berücksichtigt
bei Items die in mehreren Faktoren hohe Ladungen haben

sind Faktorladungen gleich groß sind Summenscores geeignet aber wenn Faktorladungen ungleich kann es zu Verzerrungen im Summenscore kommen
entweder höchste Ladung wählen oder nicht berücksichtigen

Umpolung von negativen Ladungen

28
Q

Wie lautet die Formel für das Umformen von Faktorladungen?

A

X*ₐ,ᵢ= [min(Xᵢ) + (max(Xᵢ)] - Xₐ,ᵢ

29
Q

Wie werden gewichtete Faktorwerte gebildet?

A
  • Items werden je nach Ladung eines Items in einem Faktor gewichtet
  • umpolen ist nicht nötig
  • Resultat: pro Faktor standardisierte Faktorwerte
  • Berechnung in Statistik Programmen
30
Q

Wofür wird die explorative Faktorenanalyse (EFA) verwendet?

A

wenn noch keine Hypothesen über Anzahl der Faktoren und der Zuordnung der Items zu Faktoren existieren
struktursuchend
hypothesengenerierend

Ziele:
1. Wie viele Faktoren für die ökonomische Darstellung der Daten nötig?
2. sind Items unidimensional?
3. Weist ein hoher/niedriger Itemwert auf einen entsprechend hohen/niedrigen Itemwert hin?
4. inhaltliche Interpretation der Faktoren
5. Welche Items genügen Gütekriterien besonders gut?

Erklärungsmodell für Korrelationen der p y1, y2, …, yp Itemvariablen durch k latente Faktoren η1, η2, … ηk

31
Q

Wofür wird die konfirmatorische Faktorenanalyse (CFA bzw. KFA) verwendet?

A
  • zuvor theoretisch festgelegte Faktorenstrukturen werden anhand empirischer Daten auf ihre Gültigkeit hin überprüft
  • Faktorenzahl und Zuordnung de Items zu den Faktoren bekannt
  • struktursuchend, hypothesenprüfend
  • Latent Trait Model bzw Strukturgleichungsmodelle (SEM) –> prüfen wie gut ein oder mehrere theoretisch formulierte Modelle die empirischen Daten beschreiben
    Zusammenhang zwischen latenten und Indikatorvariablen
    -> Verwendung von Signifikanztests als auch Indices zur Überprüfung der Modellanpassung
32
Q

Welche Merkmale hat die EFA?

A

keine Vorannahmen über Faktorenzahl
keine Ideen zu Zugehörigkeit der Items zu Faktoren
Ziel: Einfachstruktur

33
Q

Was ist mit Einfachstruktur gemeint?

A

Ziel möglichst geringe Anzahl von Faktoren zu extrahieren wobei Items möglichst eindeutig zu genau einem Faktor zugeordnet werden können

-> sparsame erklärung
-> eindeutige Interpretation

34
Q

Welche Ablaufschritte hat eine EFA?

A
  1. Aufstellung Faktorenmodells:
    Festlegung zu berücksichtigende Faktoren (gemeinsame Faktoren, laden auf mehr als ein item) und nicht zu berücksichtigende Faktoren (Residuum)
  2. Ermittlung Anzahl notwendiger Faktoren
  3. Rotation der Faktoren
  4. Beurteilung der Modellgüte und des Ladungsmusters
35
Q

Was sind gemeinsame Faktoren?

A
  • laden auf 2+ Items
  • latente Merkmalsausprägungen
  • zunächst unbekannte Ausprägungen -> erst im Vergleich können Rückschlüsse auf die Einflussgewichte und Zusammenhänge der Items und Faktoren gemacht werden
36
Q

Was ist eine Faktorladung?

A

λ des iten Items auf den jten Faktor

Maß für die Größe des Zusammenhangs zwischen jeweiligem Item und jeweiligem Faktor

Wertebereich -1 bis 1

Interpretation: Korrelationskoeffizient zwischen Item und Faktor, so lange Faktoren unkorreliert
Fehlerterm -> Anteil der Itemvarianz die nicht durch gemeinsamen Faktor erklärt wird

37
Q

Was ist das Fundamentaltheorem der Faktorenanalyse?

A

Antwortmuster können durch eine endliche Anzahl von gemeinsamen Faktoren und einen verbliebenen, unerklärbaren Anteil erklärt werden

38
Q

Welche Methoden der Faktorenextraktion kennen wir?

A

Hauptachsenanalyse
Maximum-Likelihood-Faktorenanalyse

39
Q

Welche Abbruchkriterien der Faktorenextraktion kennen wir?

A

Kaiser Guttman Kriterium = Eigenwert>1
Vorteil: einfach
Nachteil: zu viele Faktoren

Elbow Kriterium, Scree Test
= Kurve im Eigenwertdiagram
Vorteil: gut wenn eindeutiger Knick
Nachteil: nicht gut wenn nicht eindeutig

Parallelanalyse: vgl Zufallsdaten
1. Datengenerierung entsprechend Populationsmodell mit Annahme dass ale Variablen unkorreliert
2. Auswertung -> Fehler auf Grund von Stichprobenschwankungen werden minimiert
3. Visualisierung der Eigenwertverläufe (-> Scree Plot)
Vorteil: zuverlässige Ergebnisse
Nachteil: aufwendig

40
Q

Was ist der Likelihood-Quotienten-Test oder auch Modelldifferenztest?

A
  • 2 Modelle mit unterschiedlichen Faktoren werden verglichen
  • reagiert sensibel auf Verletzung der Normalverteilung
41
Q

Was bedeutet die Einfachstruktur im Allgemeinen?

A

ein Item soll möglichst nur eine Primärladung und nur wenige bis keine Sekundärladungen aufweisen

-> Ziel der Faktorenrotation, eindeutige Zuordnung von Items zu Faktoren

42
Q

Wie läuft die Faktoreninterpretation in der EFA?

A
  • post-hoc
  • vorsichtig
  • Zuschreibung Label zu Faktor erfolgt anhand Faktorladungen (absolute Größe und positiv/negativ berücksichtigen -> niedrige Ladungen tragen nicht zur inhaltlichen Diskriminierung im Sinne des Faktors bei)
    -> Iteminhalt repräsentativ bei Namensgebung
    -> Bedeutung der Faktoren kann sich je nach Faktorenrotationsmethdode ändern
  • hohe Korrelation der Faktoren untereinander: schwer argumentierbar dass es unterschiedliche Konstrukte sind
43
Q

Wie funktioniert die Itemauswahl der EFA?

A
  1. Items ausgewählt mit besonders hohen Faktorladungen, typischer cut off wert für gute Items = 0.3 oder 0.4
    Achtung: Breite der inhaltlichen Validität beachten
  2. ausgewählte Items sollen möglichst keine Sekundärladungen haben
  3. Items sollten nicht zu stark reduziert werden, mindestens 3-5 Items pro Konstrukt
44
Q

Welche Ablaufschritte hat eine CFA?

A
  1. Spezifikation Messmodell -> Indikatorvariable und Faktoren
    Hypothesenbildung,
45
Q

Was bedeutet Messfehler im Rahmen der CFA?

A

der überbleibende Restkorrelation nach Auspartialisierung des Einflusses der latenten Variablen auf die Korrelation zweier Indikatorvariablen -> lokale stochastische Unabhängigkeit; true score und Messfehler sind unkorreliert
= Fehlerkovarianz: systematische Zusammenhänge zwischen 2+ Indikatorvariablen

46
Q

Was ist das Interzept α?

A

-additive Konstante
-Messungen mit verschiedenen Messinstrumenten
unterschiedliche Metrik oder Kalibrierung der Messinstrumente
-auch zu beobachten wenn Items unterschiedliche Schwierigkeit (bzw Leichtigkeit) haben -> Leichtigkeitsparameter
-> kann als Interzept modellbasiert geschätzt werden

47
Q

Was ist die Faktorladung λ?

A

-multiplikative Konstante
-wie kann Änderung der latenten Variblen η übersetzt wird in eine Änderung der True Score Variablen τ
-hängt numerisch zusätzlich von Skalierung der Messinstrumente ab

48
Q

Was ist die Maximum-Likelihood-Methode?

A

Voraussetzungen:
- korrekt spezifiziertes Modell: multivariat normalverteilte Daten, lineare Beziehungen zwischen kontinuierlichen und manifesten Variablen
- maximiert Likelihood dass bei Gültigkeit des Modells in der Population die empirische Kovarianzmatrix resultiert
- Likelihood maximal wenn Differenz zwischen empirischer und modellimplizierter Kovarianzmatrix möglichst gering sind -> Diskrepanzfunktion minimal

49
Q

Wie werden geschachtelte Modelle geprüft?

A

unterscheidet sich der Modellfit eines restriktiveren Modell mit weniger frei geschätzten Parametern und daher mehr Freiheitsgraden signifikant von einem weniger restriktiven Modell?
- Chi2 Differenztest
prüft Nullhypothese: kein Unterschied
H0: ΣA=ΣB
-> Differenz der Chi2 Werte und der Freiheitsgrade gebildet
Differenz kann auf Signifikanz geprüft werden
Parsimonität: ein nicht signifikanter Differenzwert (p> .01) spricht für das strengere Modell

50
Q

Was ist Messinvarianztestung?

A

Messinstrument misst in allen Gruppen bzw über die Zeit hinweg das selbe Merkmal in gleicher weise
Mittelwertestruktur muss beachtet werden