Explorative Faktoranalyse (PCA) Flashcards
(22 cards)
Zwei Vektoren stehen im Winkel von a aufeinander.
Wie berechnet sich der Korrelationskoffizient r nach Pearson ?
wie wird der Winkel berechnet wie zwei Vektoren aufeinander stehen wenn nur der Abstand gegeben ist ?
Was ist die Grundannahme der explorativen Faktorenanalyse ?
- Erkennung von Strukturen in großen Variablensets
- indem durch die beobachtbare (manifest) Variable, eine geringe Anzahl, zugrundeliegenden nicht beobachtbarer (latenter) Faktoren erklärt werden
Wie lässt sich eine Hauptkomponentenalyse geometisch interpretieren ?
- Rotation des ursprünglichen Koordinatensystems
- sodass die Faktoren rechwinklich zueinander stehen
- & die erste Hauptkomponente möglichst viel Varianz beschreibt
geometrische Interpretation: Es ist der Kosinus, des Winkels der beiden Vektoren
Nach welchen Kriterium wird die erste Hauptkomponente bei der PCA festgelegt ?
- 1 Hauptkompoente: Erklärung maximaler Varianz
- 2. Hauptkomponente: muss linear unabhängig sein
- darum rechtwinklig zur 1ten
Was ist die Kovarianz
- Maß für die lineare Beziehung zw. zwei Variablen (X & Y)
- Positive Kovarianz: Beide Variablen steigen/sinken gemeinsam
- negative Kovarianz: Eine Variable steigt, während die andere sinkt
-
Nahe 0: keine lineare Beziehung
!Kovarianz zeigt Richtung und Stärke gemeinsamer Variation, aber nicht deren Stärke unabhängig von den Einheiten!
Was versteht man unter Loadings (Faktorname)
- Korrelation zw. ursprünglicher Variable & neuen Faktor
Was versteht man unter Kommunalitäten ?
- Wie viel Varianz des Item kann durch alle Faktoren dargestellt werden
Was versteht man unter Eigenwert der Komponente
- gibt von der Komponente erklären Varianz an
- Wie gut repräsentiert mein Faktor alle meine Variablen
Aus welchen Anteilen setzt sich die Varianz der beobachtbaren (manifesten) Variable zusammen ?
- Fehler Varianz
- Gemeinsame Varianz
- Spezifische Varianz
Aus welchen Anteilen setzt sich die Varianz der unbeobachten (latenten) Variable zusammen ?
1) Gemeinsame Varianz
2) Einzigartige Varianz
Einzigartig = Spezifische + Messfehler
Was ist ein Bartlett - Test ?
- Test, um zu prüfen, ob mehrere Gruppen gleiche Varianzen haben (Homogenität der Varianzen).
- Er testet die Nullhypothese, dass die Varianzen der Gruppen gleich sind.
- Der Test basiert auf einer Chi-Quadrat-Verteilung.
- Er wird häufig vor der Durchführung einer ANOVA angewendet, um die Annahme der gleichen Varianzen zu überprüfen.
- Signifikantes Ergebnis (p-Wert < 0.05) : bedeutet, dass die Varianzen der Gruppen unterschiedlich sind.
- Nicht signifikantes Ergebnis (p-Wert > 0.05) : bedeutet, dass die Varianzen der Gruppen als gleich betrachtet werden können.
Welche Hypothese überprüft der Bartlett - Test ?
- H₀: Korrelationsmatrix = Einheitsmatrix (keine Korrelationen).
- H₁: Korrelationsmatrix ≠ Einheitsmatrix (signifikante Korrelationen).
wird genutzt um zu überprüfen ob es Zusammenhänge (Korrelationen) zw. Variablen gibt
Woher weiß man nach Durchführung des Bartlett - Test, ob der Datensatz für eine Fakrotanalyse geeignet ist oder nicht ?
- p-Wert < 0.05: Daten geeignet für Faktoranalyse.
- p-Wert > 0.05: Daten nicht geeignet für Faktoranalyse
Beispiel von einem R- Output, nach einem Bartlett - Test, wo die Daten für eine Faktoranalyse geeignet sind
Beispiel von einem R- Output, nach einem Bartlett - Test, wo die Daten für eine Faktoranalyse NICHT geeignet sind
Was schränkt an diesem Beispiel die Aussagekraft des Bartlett - Test ein ?
Was ist die PCA und das ist FA?
PCA = Hauptkomponenten analyse
FA = Faktorenanalyse
Was ist beim R-Output der prop. Mediated?
- Prozentsatz welcher vom total Effekt auf den indirekten Pfad geht
- Formel: ACME : Total Effekt
- Beispiel: 59% des gesamten Effekts werden über den Mediationseffekt erklärt
Was bedeutet es, wenn eine Variable standardisiert wird?
- dimensionslos
- Mittelwelt = 0
- Standardabweichung = 1
Herleitung:
1) Zentrieren (Einheit rauslöschen) - Mittelwert berechnen
- Anschließend von jedem einzelnen Fall Mittelwert abziehen
Wie kann man den Parameter (Estimate) Total Effect = 0,4695 inhaltlich interpretieren ? (Standardisiert)
Wenn der Wert der UV sich um 1 Standardabweichung erhöht, steigt der Wert der AV um 0,4695 Standardabweichungen
Was bedeutet es inhaltlich, wenn eine Hauptkomponentenanalyse auf Basis einer Kovarianzmatrix gerechnet wird anstatt wie meistens üblich auf Basis einer Korrelationsmatrix ?
- Korrelationsmatix = Standartisierte Kovarianz
- Kovarianzmatrix = nicht standardisiert
- Die Einheiten werden berücksichtigt
- in den Einheiten die Absoluten Werte werden berücksichtigt
Eine Kovarianzmatrik macht Sinn, wenn es identische Einheiten sind. Bei unterschiedlichen Einheiten (Schuhgröße, Körpergröße) bei Korrelationsmatix bleiben