Multivariate Verfahren Flashcards

Question

2) Es soll überprüft werden, ob die Form der Verpackung einer Seife einen Einfluss auf die wahrgenommene Attraktivität der Seife hat. Dazu werden 3 Verpackungsformen von je einer Gruppe bzgl. Attraktivität und Kaufbereitschaft auf Ratingskalen zu beurteilen.

Answer 1

``` 2 einfaktorielle Varianzanalysen (ohne Messwiederholung): UV: Verpackungsform (3 Faktorstufen/Gruppen) AV 1 : Attraktivitätsratings AV 2 : Ratings der Kaufbereitschaft ``` ``` Alternativ (und sogar m.E. besser): Multivariate Varianzanalyse rechnen, in der beide AV.s gleichzeitig berücksichtigt werden. MONAVA Heißt es gibt 2 AV ```

Answer 2

``` 2-faktoriell ohne MWH (2 Gruppierungsfaktoren) UV1: Markenname (3 Stück) UV2: Absatzweg (2 Stück) AV: Absatz ```

Answer 3

1-faktoriell (ohne Messwiederholung) UV: Diätform AV: Körpergewicht

Answer 4

Lösung: Einfaktorielle Varianzanalyse mit Messwiederholung (UV: Woche) ANOVA

Answer 5

Lösung: Überprüft eine zentrale Voraussetzung für die Durchführung einer Messwiederholungs-Varianzanalyse, nämlich die Sphärizitäts- /Zirkularitätsannahme, die besagt, dass die Korrelationen zwischen Faktorstufen homogen sind (Zirkularitätsannahme), bzw. dass die Varianzen der Differenzen zwischen den einzelnen Faktorstufen homogen sind (Sphärizitätsannahme). Die beiden Annahmen gehen miteinander einher, wobei die Sphärizitätsannahme stärker ist. Hier ist Mauchly’s Test signifikant. Dies heißt, dass die Sphärizitätsannahme nicht erfüllt ist. Deshalb sollte man hier die korrigierten Überschreitungswahrscheinlichkeiten/Signifikanzen zugrunde legen, bei denen eine Freiheitsgradkorrektur vorgenommen wurde, um falschen Entscheidungen aufgrund des aufgrund der Verteilungsverletzung verzerrten ursprünglichen Signifikanztests entgegenzuwirken. Hierbei stehen zwei Korrekturmöglichkeiten zur Verfügung (1) nach Greenhouse-Geisser (GGe), (2) nach Huyn-Feldt (HFe)). (1) ist die konservativere und allgemein anerkanntere. Auch nach GG-Korrektur ist der Effekt von Woche noch signifikant.

Answer 6

Lösung: Der Effekt von Woche ist sogar nach G(reenhouse)-G(eisser)-Korrektur signifikant, d.h. mindestens 2 Zeitpunkte unterscheiden sich signifikant voneinander; jetzt weiß man aber noch nicht, welche Zeitpunkte sich voneinander unterscheiden (Ähnliches gilt im Übrigen auch für Varianzanalysen ohne Messwiederholung, wenn Faktoren mit >2 Faktorstufen im Spiel sind – ein signifikanter (Haupt-) Effekt in der Varianzanalyse sagt auch da nur, dass sich mindestens 2 der Gruppen überzufällig unterscheiden, aber nicht welche.

Answer 7

Lösung: t-Tests für abhängige Stichproben (Vorsicht: Alpha-Fehler-Inflation, s.o.; Bonferroni-Korrektur ist angebracht), s.a. Fisher Least Square Differences; Vorsicht: Bei post-hoc Analysen von Varianzanalysen mit unabhängigen Stichproben (ohne Messwiederholung) sollten für Paarvergleiche gängige Verfahren angewendet werden, die inhärent für Alpha-Fehler-Inflation korrigieren, z.B. Tukey HSD, s. FLB II, S. 53 ff., Zusatzmaterialien Outputblock IX FLB II ).

Answer 8

Lösung: Zweifaktorielle VA ohne Messwiederholung/ mit 2 | Gruppierungsfaktoren

Answer 9

Wenn Linien nicht parallel Laufen dann ist ein Interaktionseffekt wahrscheinlich.

Answer 10

Lösung: - Die inhaltliche Interpretation der Ergebnisse hängt davon ab, ob hohe Werte eine niedrige Aufmerksamkeitsleistung signalisieren oder eine hohe. Einmal angenommen, hohe Werte signalisieren hohe Aufmerksamkeitsleistungen: Weil es hier jeweils nur 2 Faktorstufen pro Faktor (A, B) gibt, lassen sich die Ergebnisse eindeutig interpretieren: - Haupteffekt B: die Aufmerksamkeitsleistungen sind besser in der Koffeinbedingung als in der Bedingung ohne Koffein. - Interaktion A*B: Der Koffeineffekt wird durch Alkohol moderiert, und zwar dahingehend, dass der Unterschied zwischen Koffein und nicht Koffein unter (leichtem) Alkoholeinfluss stärker ist. - Hätten die Faktoren mehr als 2 Faktorstufen/Ausprägungen gehabt, hätte man auch hier Kontraste oder post-hoc Vergleiche aufsetzen müssen, um herauszukriegen, welche Faktorstufen(kombinationen) sich eigentlich unterscheiden.

Answer 11

Lösung: - Bedingte Wahrscheinlichkeiten: Wahrscheinlichkeiten, einem bestimmten Krankheitsmodell zuzuneigen, gegeben die Zugehörigkeit zu einer bestimmten Disziplin (z.B. Wahrscheinlichkeit für Psychosoziales Modell gegeben Psychologe: P(Y=0/X=0) = 9/11=.82; geht theoretisch auch andersrum (bedingte Wahrscheinlichkeit, ein bestimmtes Krankheitsmodell zu wählen, gegeben eine Disziplin —>von inhaltlichen Fragen abhängig machen, welche Richtung der Berechnung sinnvoll ist) - Odds (Chancen): Verhältnis zweier komplementärer bedingter Wahrscheinlichkeiten; z.B. die Chance als Psychologe das psychosoziale Krankheitsmodell zu wählen ist 4.5 Mal höher als das organische Krankheitsmodell zu wählen: Chance =n11/n21 = 9/2 = 4,5 Das Odds Ratios (OR) beschreiben Chancenverhältnisse, die zwei Chancen miteinander vergleichen. Beispiel: Das OR für die Chance, das psychosoziale gegenüber dem organischen Krankheitsmodell zu wählen im Verhältnis zu der gleichen Chance bei Medizinern —> Um welchen Faktor erhöht sich das „Risiko“, das psychosoziale Krankheitsmodell anzulegen wenn man Psychologe ist – im Beispiel ist die Chance/ das Risiko fast 16x so hoch wie bei Medizinern: OR = n11/n21 //n12/n22 = 9/2 // 2/7 = 15,75

Answer 12

Lösung: Logit (Alkohol=1) = -13.987 + 1.633*Erbevorbelastet + 0.144*Umfeldmittel + 2.096*Umfeldgroß + 0.417 Alter + 0.231*Reizhunger

Answer 13

Lösung: Erbe, Umfeld (groß vs. gering), Reizhunger (unter coefficients: z= b/s b; p < .05)

Answer 14

Lösung: Wenn Erbe um 1 Einheit steigt (von nicht vorbelastet zu vorbelastet), erhöht sich das erwartete Logit für Alkoholmissbrauch um 1.633 Einheiten – bei Konstanthaltung aller anderen Prädiktoren; Das dazugehörige OR eb-erbe ist 5.122 —>bei erblich Vorbelasteten ist das Risiko für Alkoholmissbrauch um das ca. 5fache erhöht im Vergleich zu nicht vorbelasteten.

Answer 15

Lösung: | (eb-alter)3 = OR(Alter)hoch3=1.52hoch3= 3.51-fach erhöht

Answer 16

Lösung: Das Konfidenzintervall schließt den Wert 1 ein (und ein OR von 1 besagt, dass die Chance/das Risiko für geringe und mittlere Bedeutung im Umfeld gleich ist).

Answer 17

Lösung: Dies ist ein Pseudo-R2 und kann analog zum Bestimmtheitsmaß der multiplen Regression interpretiert werden: Durch alle Prädiktoren zusammen werden 56,2 % der Varianz im Kriterium aufgeklärt.

Answer 18

Lösung: Null Deviance: LogLikelihood-Wert des Nullmodells (-2LL0), Residual Deviance: Loglikelihood-Wert des vollständig spezifizierten Modells (-2LLv) . Je kleiner der Wert, desto besser die Anpassung. Für das vollständig spezifizierte Modell ist der Wert 83.18-50.35=30.83 kleiner. (In SPSS wird diese Differenz per LR-Test getestet).

Answer 19

Lösung: OR = 9: Wahrscheinlichkeit für Brustkrebs mit „erblicher Vorbelastung“ 9fach erhöht gegenüber „keine erbliche Vorbelastung“.

Answer 20

Lösung: Ziel der Clusteranalyse ist Personen oder Objekte nach bestimmten Merkmalen (z.B. verschiedene Indizes der Internetnutzung) zu kategorisieren. Dazu wird betrachtet, wie weit Personen/Objekte aufgrund Ihrer Merkmale voneinander entfernt sind. Liegen diese Personen nahe bei einander, könnten Sie in eine Gruppe zusammengefasst werden. Liegen sie weit weg voneinander, ist die Gruppierung weniger sinnvoll. Beispielsweise könnte man so verschiedene Charaktertypen (bzw. Internet- Nutzertypen) identifizieren, indem im Vorfeld Fragen erhoben werden.

Answer 21

Lösung: Ein Dendrogramm visualisiert die Clusteranalyse. Auf der x-Achse sind alle Personen abgetragen, die in die Analyse einbezogen wurden. Auf der y- Achse ist die „Distanz“ der Personen oder Cluster zueinander abgetragen. Werden zwei Personen zusammengefügt, so bilden diese fortan ein Cluster. Diese Cluster können dann wiederum mit anderen Personen oder anderen Clustern zusammengefügt werden. Wie weit die Cluster voneinander entfernt liegen, lässt sich an der Länge der Geraden erkennen, die vor der Zusammenführung zu den bisherigen Clustern führt. Auch die Reihenfolge der Zusammenführungen lässt sich erkennen, sodass auf einen Blick erkannt werden kann, welche Cluster sich bei einer 2- oder einer 3-Clusterlösung ergeben.

Answer 22

Lösung: Eigenwert: - Höhe der durch jeweils einen Faktor erklärten Varianz aller beobachteten Variablen - Summe der quadrierten Faktorladungen des Faktors über alle Variablen hinweg - Sollte größer als 1 sein, da der Faktor erst dann mehr Varianz als eine einzelne Variable aufklärt Kommunalität eines Items: - Höhe der Varianz eines einzelnen Items, die über alle Faktoren hinweg erklärt wird - Summe der quadrierten Ladungen über alle Faktoren hinweg bei einem Item Einfachstruktur: Bei einer Einfachstruktur laden nur bestimmte Variablen hoch auf einem Faktor und sehr niedrig auf alle anderen Faktoren. Faktorladung: Die Faktorladung aij D(Faktorladung des j-ten Faktors auf die i-te Variable (j = 1,...,m; i=1,...,p)) aus Formel (1) entspricht der Korrelation zwischen der i- ten Variablen und dem j-ten Faktor. Hohe Faktorladungen drücken gemäß dem Modell der Hauptkomponentenanalyse (Formel (1)) aus, dass der jeweilige Faktor, der eine nicht messbare Eigenschaft einer Person repräsentiert, einen hohen Einfluss auf die Ausprägungen der Variablen

Answer 23

Problem: - anfängliche Faktorenlösung ist inhaltlich oft nicht interpretierbar Lösung: - Drehung des Faktorraums/Transformation der Faktorladungen, um eine Einfachstruktur zu erreichen Orthogonale Rotation: - Unkorreliertheit der Faktoren wird beibehalten - Faktoren können auch nach der Rotation unabhängig voneinander interpretiert werden - z.B. Varimax Oblique Rotation: - Unkorreliertheit der Faktoren wird aufgegeben - z.B. Promax

Answer 24

Lösung: Kaiser-Kriterium: - Alle Faktoren mit Eigenwert größer 1 werden als bedeutsam angesehen - Problem: überschätzt oft die tatsächliche Anzahl von Faktoren Scree-Test: - Grafische Darstellung des Eigenwertverlaufs - Extraktion aller Faktoren vor dem Knick - Problem: oft uneindeutig Parallelanalyse: - Generierung von mindestens 100 (oder 1000) Datensätzen mit Zufallszahlen, die einer Faktorenanalyse unterzogen werden - Extrahiert werden alle Faktoren, deren ursprünglich beobachtete Eigenwerte größer sind als die jeweiligen gemittelten Eigenwerte aus den Zufallsdatensätzen der Parallelanalyse

Answer 25

Ergänzen Sie mit Hilfe der Abbildung folgende Tabelle: Kriterium Anzahl der Faktoren Theorie 2 Kaiser-Guttman 5 Scree-Plot 2 oder 4 Parallelanalyse 3

Answer 26

``` PC1 h2 u2 SS loadings Cumm var ```

Answer 27

Lösung: Unrotierte Komponentenlösungen sind zumeist schwer zu interpretieren, da zumeist keine Einfachstruktur gegeben ist. Die Promax-Rotation ist sinnvoll, da anzunehmen ist, dass die einzelnen Faktoren nicht unabhängig voneinander sind (Subskalen eines psychologischen Konstrukts).

Multivariate Verfahren Flashcards

Win (51 cards)