03 Gütekriterien Flashcards
(40 cards)
Was sind die drei Haupttestgütekriterien?
Objektivität = Unabhängigkeit der Messung
Reliabilität = Zuverlässigkeit (Genauigkeit) der Messung
Validität = Gültigkeit der Messung
Was gibt die Objektivität an?
in welchem Maß die Testergebnisse vom Testanwender unabhängig sind
In welche drei Unterbereiche kann man die Objektivität unterteilen?
o Durchführungsobjektivität
o Auswertungsobjektivität
o Interpretationsobjektivität
Was gilt für die Durchführungsobjektivität?
- Durchführungsbedingungen müssen genau spezifiziert sein
- Durchführung unabhängig von Testleiter:in immer gleich (Ausschluss des Einflusses von Störvariablen)
- Anweisungen im Testmanual
Welche Anweisungen sollten im Testmanual bei der Durchführungsobjektivität gegeben sein?
o Zeitvorgaben
o Benötigte Materialien
o Umgang mit Fragen und Störungen
o Standardisierte Instruktionen
Wann kann die Durchführungsobjektivität als hoch oder gegeben angesehen werden?
wenn alle Bedingungen festgelegt sind, die sich auf das Testverhalten auswirken können
Was gilt bei der Auswertungsobjektivität?
- Genaue Angaben, wie eine Antwort zu verstehen ist, müssen vorliegen (= Auswertungsregeln)
- Das Testergebnis hängt nicht von Auswerter:in ab
- kann numerisch bestimmt und somit angegeben werden (Auswerterübereinstimmung)
Inwiefern kann das Testergebnis nach der Auswertungsobjektivität von der Auswerter*in abhängen?
o richtig oder falsch (z.B. Leistungstest)
o hoch oder niedrig (z.B. Persönlichkeitstest)
o gegeben oder nicht (z.B. Klinische Diagnose
Wann gilt die Auswertungsobjektivität als hoch oder gegeben?
wenn klare Anweisungen und Hilfsmittel (z.B. Schablonen, Computertests) zur Auswertung vorliegen
Was versteht man unter Interpretationsobjektivität?
- Klare Vorgaben, was individuelle (numerische) Rohwerte bedeuten (→ Normierung)
- Testergebnis unabhängig von Ort, Zeit, Testleiter:in und Auswerter:in
o Leistung in einem Test → unterdurchschnittlich, normal, überdurchschnittlich (gemindert, normal, hochbegabt)
o Persönlichkeitsausprägung → normal vs. extrem
o Anzahl gegebener Symptome → Störungsbild
Wann kann die Interpretationsobjektivität als hoch oder gegeben angesehen werden?
wenn genau beschrieben ist, wie man von einem Rohwert zu einer Aussage über die Merkmalsausprägung gelangt (Normtabellen, Kriterien)
Welche Verfahren können verwendet werden, um die Reliabilität einer Messung zu erhöhen?
- Zweimalige Erfassung des gleichen Merkmals
o Retest
o Paralleltest
o Testhalbierung - Über Interkorrelation der Items
o Interne Konsistenz
Wie setzt sich der Testwert zusammen?
Kombination des ”wahren” Messwertes (True Score) und Abweichung
xi=τi+ϵi
Was ist der (Mess-)Fehler?
Diskrepanz zwischen dem beobachteten Wert und dem True-Score
Was sind die drei Annahmen den klassischer Testtheorie?
- Mittelwert der Messfehler ist 0 (Messfehler als Abweichung):
M(ϵi ) = 0 - True Scores und Fehler sind unkorreliert (hängen nicht voneinander ab):
Cov(τi, ϵi ) = 0 - Die Fehler sind untereinander unkorreliert:
Cov(ϵi,ϵj ) = 0
Was kennzeichnet die Reliabilität und wie ist sie mathematisch definiert?
- Reliabilität (Zuverlässigkeit) eines Tests kennzeichnet den Grad der Genauigkeit (Präzision), mit dem das geprüfte Merkmal gemessen wird
- Die Reliabilität ist definiert als das Verhältnis der Varianz der True-Scores und der beobachteten Testwerte
rel(X) = Var(T)/Var(X) = Var(T)/ (Var(T)+Var(ϵ))
Was ist der Maximal- und der Minimalwert der Reliabilität und was bedeuten sie?
Maximalwert: rel(X) = 1
o Die Varianz der Messfehler ist 0
o Die Messung ist frei von Messfehlern
Minimalwert: rel(X) = 0
o Die Varianz der True Scores ist 0
o Die Messung reflektiert nur Messfehler
Wie groß sollte die Reliabilität sein, ab wann wird es problematisch?
Reliabilität sollte >.80 sein; problematisch, wenn <.60
Durch welche Variablen ist die Reliabilität definiert?
durch nicht direkt beobachtbare Variablen definiert (True-Score- und Fehlervarianz)
Was ist der Re-Test? Wann wird er eingesetzt?
- Person mehrmals mit dem demselben Test untersuchen
- zeitstabile Merkmale (z.B. Intelligenz, SES etc.): wahrer Wert einer Person bleibt identisch, Fehleranteil variiert
- Korrelation zwischen beiden Messzeitpunkten Schätzer der Reliabilität
Was sind die Probleme beim Retest?
o Reliabilität vs. Stabilität
o Lerneffekte
Was ist der Paralleltest?
- zwei parallele Testversionen, die das Merkmal X identisch operationalisieren
- Beide Testversionen werden von einer Person bearbeitet
- Korrelation zwischen den Tests ist Schätzer der Reliabilität:
Was sind die Probleme beim Paralleltest?
o Parallele Versionen?
o Hoher Aufwand
o Positionseffekte (Ermüdung, Transfer etc.)
Was ist die Testhalbierung?
- verschiedene Teile des gleichen Tests kommen zu ähnlichen Ergebnissen
- Untersuchung einer Stichprobe mit einem Test danach Items in zwei Hälften aufteilen
- Korrelation zwischen den beiden Testhälften dient als Schätzer der Reliabilität