VL3 Gütekriterien: Objektivität & Reliabilität Flashcards

(38 cards)

1
Q

Was sind die Hauptgütekriterien psychologischer Tests?

A

Objektivität, Reliabilität, Validität

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was bedeutet Objektivität in der Diagnostik?

A

Ein Testergebnis ist unabhängig davon, wer den Test durchführt, auswertet oder interpretiert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Welche Arten von Objektivität gibt es?

A

Durchführungsobjektivität, Auswertungsobjektivität, Interpretationsobjektivität

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist Durchführungsobjektivität?

A

Standardisierte Instruktionen und Bedingungen sichern, dass die Testdurchführung nicht vom Testleiter beeinflusst wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was sind Praxisprobleme der Durchführungsobjektivität?

A

Abweichungen bei Kindern, alten oder klinischen Personen; unzureichend geschulte Testleiter:innen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist Auswertungsobjektivität?

A

Ein identisches Antwortverhalten führt bei allen Auswerter:innen zur gleichen Auswertung – gegeben bei klaren Auswertungsregeln.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was sind Probleme bei der Auswertungsobjektivität?

A

Fehlende Klarheit im Manual, Übertragungsfehler, uneinheitliche Auswertung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist Interpretationsobjektivität?

A

Unterschiedliche Diagnostiker:innen ziehen aus demselben Rohwert dieselben Schlüsse – durch Normtabellen und Hilfen unterstützt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was sind Probleme bei der Interpretationsobjektivität?

A

Fehlende oder uneinheitliche Interpretationstabellen, unterschiedliche Cut-off-Werte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was bedeutet Reliabilität?

A

Ein Test misst ein Merkmal zuverlässig und liefert bei Wiederholung unter gleichen Bedingungen stabile Ergebnisse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist die Grundformel zur Messung in der Reliabilitätstheorie?

A

Xi = Ti + Ei (Testwert = wahrer Wert + Messfehler)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Welche Arten von Reliabilität gibt es?

A

Paralleltest-Reliabilität, Retest-Reliabilität, Split-Half-Reliabilität, Interne Konsistenz

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist Paralleltest-Reliabilität?

A

Zwei parallele Testversionen mit ähnlicher Schwierigkeit und Trennschärfe werden miteinander korreliert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist Retest-Reliabilität?

A

Der gleiche Test wird zweimal gegeben. Die Korrelation ergibt die Reliabilität. Abhängig von Zeitintervall und Merkmalstabilität.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was ist Split-Half-Reliabilität?

A

Ein Test wird in zwei Hälften geteilt. Korrelation der Hälften, korrigiert durch Spearman-Brown-Formel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist interne Konsistenz?

A

Korrelation aller Items miteinander. Maß: Cronbachs Alpha oder McDonald’s Omega.

17
Q

Wie wird Cronbachs Alpha beeinflusst?

A

Höher bei vielen Items und hoher Interkorrelation; niedriger bei geringer Varianz oder heterogener Struktur.

18
Q

Ab welchen Werten gilt Cronbachs Alpha als akzeptabel?

A

<.70: nicht akzeptabel, >.70: akzeptabel, >.80: gut, >.90: sehr gut

19
Q

Was ist das Problem bei kurzen Tests mit hohem Alpha?

A

Items sind oft redundant – Test ist konsistent, aber nicht differenzierend.

20
Q

Wann ist Cronbachs Alpha nicht aussagekräftig?

A

Wenn Items nicht unidimensional sind – also unterschiedliche Konstrukte messen.

21
Q

Was ist McDonald’s Omega?

A

Alternatives Maß zur internen Konsistenz, das ungleiche Itemgewichte berücksichtigt – genauer bei heterogenen Items.

22
Q

Was ist Itemschwierigkeit?

A

Anteil der Personen, die ein Item im Sinne des Merkmals gelöst haben. Ideal: mittlere Schwierigkeit.

23
Q

Was ist Trennschärfe?

A

Gibt an, wie gut ein Item das Gleiche misst wie der Gesamttest – Korrelation Item mit Gesamtskala.

24
Q

Was bedeutet Itemschwierigkeit und wie wird sie berechnet?

A

Gibt an, wie viele Personen ein Item im Sinne des Merkmals bearbeitet haben. Formel: p = (NR / N) * 100

25
Was bedeutet eine Itemschwierigkeit von 0 bzw. 100?
0 %: niemand löst das Item. 100 %: alle lösen es. Beide → keine Varianz, unbrauchbar zur Differenzierung.
26
Was bedeutet Trennschärfe?
Korrelation eines Items mit dem Gesamttest. Zeigt, wie gut ein Item das misst, was der Test misst.
27
Warum wird bei der Trennschärfe die part-whole-Korrektur verwendet?
Damit das Item nicht mit sich selbst korreliert – Item wird bei Skalenwert ausgeschlossen.
28
Was ist Cronbachs Alpha?
Maß für interne Konsistenz. Zeigt, wie gut Items miteinander korrelieren und dasselbe Merkmal erfassen.
29
Was beeinflusst Cronbachs Alpha?
Anzahl der Items, Höhe der Iteminterkorrelation, Varianz der Stichprobe.
30
Warum kann ein hoher Alpha-Wert auch problematisch sein?
Weil bei kurzen Tests ein hoher Alpha auf Itemredundanz hindeutet.
31
Was bedeutet Unidimensionalität im Zusammenhang mit Alpha?
Alle Items sollen dasselbe Konstrukt messen – Voraussetzung für sinnvolle Interpretation von Alpha.
32
Wann ist Reliabilität zu niedrig für praktische Anwendung?
Unter .85 – zu breite Konfidenzintervalle, unsichere Urteile.
33
Warum ist Reliabilität kontextabhängig zu bewerten?
Je nach Anwendung ist mehr oder weniger Genauigkeit nötig – Forschung vs. Individualdiagnostik.
34
Was ist McDonald’s Omega und wann ist es Cronbachs Alpha überlegen?
Alternatives Maß für interne Konsistenz. Besser geeignet bei ungleichen Itemgewichten oder heterogenen Items.
35
Was versteht man unter der Objektivität von Messverfahren? Welche Facetten gibt es?
Definition: Objektivität liegt vor, wenn das Testergebnis unabhängig davon ist, wer den Test durchführt, auswertet und interpretiert. 🔹 Durchführungsobjektivität: Standardisierte Instruktionen & Testsituation Problem: Abweichungen durch ungeschulte Testleiter, Kinder, ältere/klinische Personen 🔹 Auswertungsobjektivität: Exakte Auswertungsregeln im Manual Hilfsmittel: Schablonen, computergestützte Verfahren Problem: Schlechte Dokumentation, Übertragungsfehler 🔹 Interpretationsobjektivität: Verschiedene Diagnostiker kommen zur gleichen Schlussfolgerung Voraussetzung: klare Normtabellen, Interpretationshilfen Problem: uneinheitliche Cut-Offs, vage Anleitungen
36
Was versteht man unter der Reliabilität von Messverfahren? Welche Facetten gibt es?
🟩 Definition: Ein Test ist reliabel, wenn er ein Merkmal zuverlässig misst (Messgenauigkeit) Formel: X = T + E (Testwert = wahrer Wert + Fehler) 🔸 Paralleltest-Reliabilität: Zwei parallele Versionen → Korrelation der Ergebnisse Vorteil: unabhängig von Erinnerungseffekten 🔸 Retest-Reliabilität: Gleicher Test, gleiche Personen, zwei Zeitpunkte Korrelation = Maß für Stabilität Problem: beeinflusst durch Zeitintervall & Merkmalsstabilität 🔸 Split-Half-Reliabilität: Test wird halbiert, Korrelation der Hälften Schätzung durch Spearman-Brown-Korrektur 🔸 Interne Konsistenz: Korrelation aller Items untereinander Maß: Cronbachs Alpha Problem: stichprobenabhängig, hohe Alpha bei vielen Items, redundante Inhalte 🔸 McDonald’s Omega: Alternativmaß, berücksichtigt unterschiedliche Itemgewichte Genaue Schätzung bei ungleich starken Items
37
Welche Faktoren beeinflussen Cronbachs Alpha?
📌 Einflussfaktoren: Anzahl der Items (mehr Items = höheres Alpha) Höhe der Item-Interkorrelationen Homogenität der Stichprobe (heterogene SP → höheres Alpha) Unidimensionalität muss gegeben sein Achtung bei zu hohem Alpha bei kurzen Tests → oft Redundanz 📎 Interpretation: Alpha < .70: inakzeptabel Alpha ≥ .70: akzeptabel Alpha ≥ .80: gut Alpha ≥ .90: sehr gut In der Praxis sollte α > .85 angestrebt werden
38
Was versteht man unter Itemschwierigkeit und Trennschärfe?
🟨 Itemschwierigkeit (p): Anteil der Personen, die Item „richtig“ gelöst haben Wert zwischen 0 – 100 % Bei Leistungstests: je höher, desto leichter Ziel: Items sollen differenzieren, nicht von allen gleich beantwortet werden 🟧 Trennschärfe (rit): Korrelation eines Items mit dem Gesamttest (ohne das Item selbst) Gibt an, wie gut das Item das gleiche misst wie der Gesamttest Werte ab .30 akzeptabel, ab .50 gut Wichtig für Itemselektion & Testkonstruktion