Testtheorie& Testkonstruktion Flashcards

Question 1

Q

Was ist eine Testtheorie?

Answer

A

Unter einer Testtheorie versteht man die Gesamtheit der Methoden zur Behandlung jener Fragestellungen, die sich bei der Testkonstruktion und Testauswertung ergeben.

Im speziellen geht es um den Zusammenhang zwischen Testverhalten und Testmerkmal.

Question 2

Q

Was ist die Klassische Testtheorie?

Answer

A

Die Klassische Testtheorie (KTT) stellt eine Sammlung von Methoden dar, die seit Beginn des vorigen Jahrhunderts zur exakten und ökonomischen Erfassung interindividueller Unterschiede entwickelt wurden.

Question 3

Q

Was ist die Wesentliche Annahme der KTT

Answer

A

Die mit einem Test ermittelte Merkmalsausprägung eines Individuums setzt sich aus dem „wahren Wert“ dieses Individuums und einem Messfehler zusammen.

Mit den Methoden der KTT soll der Anteil dieses Messfehlers bestimmt werden -> „Messfehlertheorie“

Question 4

Q

Was besagt das Existenzaxiom?

Answer

A

Es existiert ein wahrer Wert Tvi als Erwartungswert einer Messung Xvi.
Tvi=E(Xvi)
Wobei:
Xvi: Wert einer Person v im Item i eines Tests
Tvi: „true score“ einer Person v im Item i eines Tests

Question 5

Q

Was besagt das Verknüpfungsaxiom?

Answer

A

Jede Messung Xvi setzt sich aus dem wahren Wert Tvi und einem zufälligen Messfehler Evi.
Xvi= Tvi+Evi
Wobei:
Xvi: Wert einer Person v im Item i eines Tests
Tvi: „true score“ einer Person v im Item i eines Tests
Evi: Messfehler der Messung mit Item i an Person v
Gleiches gilt für die Varianz (S², Var):
Var(Xvi)= Var(Tvi)+ Var(Evi)

Question 6

Q

Was besagt das Unabhängigkeitsaxiom?

Answer

A

Aus der Verbindung des Existenz- und des Verknüpfungsaxioms resultiert das Unabhängigkeitsaxiom.
Die Korrelation zwischen den Messfehlern E und den wahren Werten T bei beliebigen Personen und beliebigen Items ist null.
Corr(Tvi, Evi)= 0
Wobei:
Tvi: „true score” einer Person v im Item i eines Tests
Evi: Messfehler der Messung mit Item i an Person v

Question 7

Q

Was ist die Reliabilität?

Answer

A

Reliabilität: Messgenauigkeit (Zuverlässigkeit) eines Tests
Theoretisch gilt die Reliabilität als Anteil der Varianz der wahren Werte an der Varianz der beobachteten Testwerte:
Reliabilität rtt= (Varianz (T))/ (Varianz (X))
Die Reliabilität bildet die Basis zur Berechnung des Standardmessfehlers, der wiederum zur Ermittlung des Konfindenzintervalls (Vertrauensintervall, Vertrauensbereiche) benötigt wird.

Question 8

Q

Wie groß ist der Wertebereich der Reliabilität?

Answer

A

Der Wertebereich geht theoretisch von 0 bis 1.
Betrüge die Fehlervarianz Var(E)=0, hieße dies:
Rel rtt= (Var(T))/ (Var(X))= (Var(T)/ (Var(T)+Var(E))= (Var(T))/ (Var(T))=1,0
Der Test misst völlig fehlerfrei.
Betrüge die Varianz der wahren Werte Var(T)= 0, hieße dies, dass der Test nichts messen würde, das Ergebnis besteht nur aus Fehlervarianz.

Question 9

Q

Was ist die Paralleltest-Reliabilität?

Answer

A

Liegen zwei parallele Formen A und B eines Tests vor, so kann die Paralleltest-Reliabilität geschätzt werden als Korrelation der Werte der beiden Testformen:
Reliabilität rtt= Corr(XA, XB)
Zwei Tests XA und XB werden als „parallel“ bezeichnet, wenn beiden Messungen derselbe True Score T zugrunde liegt:
E(XA)=E(XE)= T
und wenn beide Tests gleiche Streuungen und gleiche Anteile von wahrer und Fehlervarianz aufweisen:
Var(XA)= Var(XB)= Var(T)+ Var(E)

Question 10

Q

Was ist die Retest- Reliabilität?

Answer

A

Aus der Definition eines Paralleltests geht hervor, dass jeder Test zu sich selbst parallel ist. Folglich kann die Reliabilitätsbestimmung auch erfolgen, indem derselbe Test zweimal (Test-Retest) derselben Stichprobe vorgegeben wird:
Reliabilität rtt= Corr(Xp1, Xp2)
Die Retest- Reliabilität wird dann als Korrelation zwischen den Messwerten zum ersten und zum zweiten Messzeitpunkt bestimmt.

Question 11

Q

Wann tritt eine Unterschätzung der Retest-Reliabilität auf?

Answer

A

Eine Unterschätzt der Retest-Reliabilität tritt auf, wenn das gemessene Merkmal zeitlich nicht stabil ist.

Question 12

Q

Wann tritt eine Überschätzung der Retest-Reliabilität auf?

Answer

A

Eine Überschätzung der Retest-Reliabilität tritt auf, wenn die 2. Messung durch Gedächtniseffekte beeinflusst wird (insb. Leistungstests).

Question 13

Q

Was ist die Split-half-Reliabilität?

Answer

A

Besteht ein Testverfahren aus einer größeren Anzahl von Items, so kann die Reliabilität über die Split-half-Reliabilität (Testhalbierungs-Reliabilität) geschätzt werden. Die Items dieses Tests werden in zwei möglichst parallele Testhälften Xa und Xb aufgeteilt und die Korrelation der zwei Testhälften bestimmt.
Rel rtt= (2*Corr(Xa,Xb))/(1+Corr(Xa,Xb)

Question 14

Q

Was bedeutet die Aufwertung einer Split-half-Reliabilität?

Answer

A

Die resultierende Halbtestkorrelation entspricht nur der Reliabilität eines Tests halber Länge. Die Korrelation der beiden Testhälften muss rechnerisch auf die volle Testlänge aufgewertet werden. Die Spearman-Brown-Korrektur beschreibt allgemein, wie sich die Reliabilität eines Tests bei Testverlängerung oder -verkürzung ändert.
rkk= (krtt)/(1+(k-1)rtt); wobei k das Vielfache der Testverlängerung bedeutet

Question 15

Q

Was ist die Interne Konsistenz?

Answer

A

Sie ist die Verallgemeinerung der Testhalbierungsmethode auf beliebig viele Testteile: Besteht ein Testverfahren aus Items, die das gleiche Merkmal erfassen, so kann auch jedes einzelne Item als separater Testteil zur Messung dieses Merkmals aufgefasst werden. Aus den Zusammenhangsstrukturen der Items kann dann die interne Konsistenz als Schätzung der Reliabilität des Testverfahrens geschlossen werden.
Cronbach’s Alpha:
Rel(x)=a= (m/(m-1))*(1-(Summe(Var(Xi))/(Var(X)))
m= Anzahl der Items
Var(Xi)= Varianz des Items i
Var(X)= Varianz des Gesamttests

Question 16

Q

Was sind die Vorteile der internen Konsistenz?

Answer

A

Es muss nur eine Messung erfolgen (weniger Aufwand, keine Erinnerungseinflüsse).
Es müssen keine Parallelformen eines Tests konstruiert werden.
Das erfasste Merkmal muss zeitlich nicht stabil sein (naja, besser gesagt reicht es, wenn das Merkmal nur über die Dauer des Tests stabil ist).

Question 17

Q

Was beschreiben der Standardmessfehler und das Konfidenzintervall?

Answer

A

Bei der Bestimmung der Reliabilität hatte sich gezeigt, dass jede psychometrische Messung mit einem Fehler behaftet ist. Je höher die Reliabilität eines Tests ist, desto geringer ist der Fehler einer Messung, die mit diesem Test vorgenommen wird. Da alle Messungen mit einem Messfehler behaftet sind, kann das Ergebnis einer testpsychologischen Untersuchung eigentlich nie mit einem einzigen Wert ausgedrückt werden, sondern immer nur durch die Angabe eines Bereiches, in dem der wahre Testwert mit einer bestimmten Wahrscheinlichkeit liegt. Dieser Bereich, der die Reliabilität eines Verfahrens mit berücksichtigt, wird als Vertrauensbereich oder Konfidenzintervall bezeichnet. Je höher die Reliabilität eines psychologischen Tests ist, desto genauer ist die Messung und desto kleiner ist der Vertrauensbereich.
Rel rtt= (Var(T)/Var(X)= (Var(X)-Var(E))/Var(X)=1-(Var(E)/Var(X)
SMF= SD(E)= SD(X)√(1-Rel)
Der SMF erlaubt es, den Vertrauensbereich zu schätzen, innerhalb dessen bei gegebenem beobachtetem Wert (dem Testwert) der wahre Wert liegt:
Tv=Xv+/-ZaSMF
Dabei wird üblicherweise von einer Irrtumswahrscheinlichkeit von 5% ausgegangen, so dass za= 1,96 ist (bei zweiseitiger Fragestellung)

Question 18

Q

Welche Frage beantwortet die Kritische Differenz?

Answer

A

Unterscheiden sich zwei Testwert tatsächlich signifikant voneinander oder ist die vorliegende Differenz der zwei Werte nur auf die Messungenauigkeit der Verfahren zurückzuführen?

Question 19

Q

Was ist die Validität? (Messick)

Answer

A

Validität ist ein integriertes bewertendes Urteil über das Ausmaß, in dem die Angemessenheit und die Güte der Interpretationen und Maßnahmen auf Basis von Testwerten oder anderen diagnostischen Verfahren durch empirische Belege und theoretische Argumente gestützt sind.

Question 20

Q

Was ist die Inhaltsvalidität?

Answer

A

Der Begriff der Inhaltsvalidität bezieht sich darauf, inwieweit die Inhalte eines Tests bzw. der Items, aus denen er sich zusammensetzt, tatsächlich das interessierende Merkmal erfassen.
Überprüfung: in der Regel theoretisch-argumentativ

Question 21

Q

Was ist die Konstruktvalidität?

Answer

A

Konstruktvalidität umfasst die empirischen Befunde und Argumente, mit denen die Zuverlässigkeit der Interpretation von Testergebnissen im Sinne erklärender Konzepte, die sowohl die Testergebnisse selbst als auch die Zusammenhänge der Testwerte mit anderen Variablen erklären, gestützt wird.
Überprüfung: in der Regel experimentell/statistisch

Question 22

Q

Was ist die Kriteriumsvalidität?

Answer

A

Kriteriumsvalidität bedeutet, dass von einem Testergebnis auf ein für diagnostische Entscheidungen praktisch relevantes Kriterium außerhalb der Testsituation geschlossen werden kann.
Überprüfung: Bestehen Zusammenhänge zwischen Testergebnis und einem Außenkriterium?

Question 23

Q

Wann ist eine Untersuchung intern valide?

Answer

A

Eine Untersuchung ist dann intern valide, wenn die Unterschiede in der abhängigen Variablen zwischen verschiedenen Versuchsbedingungen eindeutig auf die Veränderungen der unabhängigen Variablen, d.h. auf die unterschiedlichen Behandlungen (Versuchsbedingungen) zurückgeführt werden können.

Question 24

Q

Was sind mögliche Einflussgrößen auf die interne Validität?

Answer

A

Zeiteinflüsse (Äußere Einflüsse die zwischen zwei Messungen eine Wirkung auf die AV ausüben)
Reifung (Biologisch-psychologische Veränderungen der Versuchsperson im Verlauf einer Untersuchung)
Testeffekte (Effekte die durch das Testen selbst entstehen, meist Kerneffekte)
Veränderung der Messinstrumente
Statistische Regression (tritt bei Untersuchungen mit Extremgruppen auf)
Auswahlverzerrungen
Experimentelle Einbußen (Ausfälle von Versuchsteilnehmern)

Question 25

Q

Wann ist eine Untersuchung extern valide?

Answer

A

Eine Untersuchung gilt als extern valide, wenn man von den Stichproben von Individuen, experimentellen Variablen und Umgebungen auf Populationen schließen kann. Es stellt sich insbesondere die Frage der Generalisierung, der Übertragbarkeit der Untersuchungsbefunde auf Situationen des Alltags oder auf andere Populationen.
Eine Untersuchung kann nur extern valide sein, wenn sie auch eine hohe interne Validität aufweist. Dies gilt nicht umgekehrt, so dass zunächst versucht wird eine hohe interne Validität zu erreichen und dann schrittweise Lebensjahre und damit komplexere Situationen als Versuchsbedingungen zu wählen.

Question 26

Q

Was versteht man unter der Objektivität?

Answer

A

Unter Objektivität wird hier verstanden, ob verschiedene Untersucher bei ein- und demselben Testbogen zu einer identischen Auswertung und Interpretation kommen. Existieren festgelegte Richtlinien hinsichtlich Auswertung und Interpretation?

Question 27

Q

Mit welcher Frage beschäftigt sich die Durchführungsobjektivität?

Answer

A

Ist die Durchführung für alle Probanden gleich bzw. sind die äußeren Bedingungen für alle identisch?

Question 28

Q

Mit welcher Frage beschäftigt sich die Auswertungsobjektivität?

Answer

A

Existieren Richtlinien dafür, wie der Fragebogen/ das Testverhalten ausgewertet werden soll?

Question 29

Q

Mit welcher Frage beschäftigt sich die Interpretationsobjektivität?

Answer

A

Existieren Richtlinien dafür, wie ein bestimmtes Ergebnis zu interpretieren ist?

Question 30

Q

Wann erfüllt ein Test das Gütekriterium der Skalierung?

Answer

A

Ein Test erfüllt dann das Gütekriterium der Skalierung, wenn die laut Verrechnungsregel resultierenden Testwerte die empirischen Merkmalsrelationen adäquat abbilden.

Question 31

Q

Was versteht man unter der Normierung eines Tests?

Answer

A

Unter der Normierung (Eichung) eines Tests versteht man das Erstellen eines Bezugssystems, mit dessen Hilfe die Ergebnisse einer Testperson im Vergleich zu den Merkmalsausprägungen anderer Personen eindeutig eingeordnet und interpretiert werden können.

Question 32

Q

Wann erfüllt ein Test das Gütekriterium der Ökonomie?

Answer

A

Ein Test erfüllt das Gütekriterium der Ökonomie, wenn er, gemessen am diagnostischen Erkenntnisgewinn, relativ wenig finanzielle und zeitliche Ressourcen beansprucht.

Question 33

Q

Wann ist ein Test nützlich?

Answer

A

Ein Test ist dann nützlich, wenn für das von ihm gemessene Merkmal praktische Relevanz besteht und die auf seiner Grundlage getroffenen Entscheidungen (Maßnahmen) mehr Nutzen als Schäden erwarten lassen.

Question 34

Q

Wann erfüllt ein Test das Gütekriterium Zumutbarkeit?

Answer

A

Ein Test erfüllt das Kriterium der Zumutbarkeit, wenn er absolut und relativ zu dem aus seiner Anwendung resultierenden Nutzen die zu testende Person in zeitlicher, psychischer sowie körperlicher Hinsicht nicht über Gebühr belastet.

Question 35

Q

Wann erfüllt ein Test das Gütekriterium Unverfälschbarkeit?

Answer

A

Ein Testverfahren erfüllt das Gütekriterium der Unverfälschbarkeit, wenn das Verfahren derart konstruiert ist, dass die zu testende Person durch gezieltes Testverhalten die konkreten Ausprägungen ihrer Testwerte nicht steuern bzw. verzerren kann.

Question 36

Q

Wann erfüllt ein Test das Gütekriterium Fairness?

Answer

A

Ein Test erfüllt das Gütekriterium der Fairness, wenn die resultierenden Testwerte zu keiner systematischen Benachteiligung bestimmter Personen aufgrund ihrer Zugehörigkeit zu ethischen, soziokulturellen oder geschlechtsspezifischen Gruppen führen.

Brainscape's Knowledge GenomeTM

Testtheorie& Testkonstruktion Flashcards

Brainscape's Knowledge Genome^TM