03 PSY - Dörfler (Allg. Psychodiagnostik) Flashcards
(64 cards)
disponieren
bestimmen, verfügen, berechnen, messen
Dichotome Aufgaben
bestehen aus zwei Antwortmöglichkeiten
substanziell
- der wesentliche Kern einer Sache
- von äußerster Wichtigkeit für einen Sachverhalt, essentieller Bestandteil
3 (Haupt-)gütekriterien
- Objektivität
- Reliabilität
- Validität
(- Skalierbarkeit)
(Nebengütekriterien: Normierung, Vergleichbarkeit, Ökonomie, Nützlichkeit, Zumutbarkeit, Fairness, Nicht-Verfälschbarkeit)
Objektivität
- Standardisierung
- Unabhängigkeit v. den Untersuchenden
-> Wie stark hängt das Ergebnis davon ab, wer den Test durchführt, leitet, auswertet und interpretiert?
- Durchführungsobj. -> exakt beschreibende Testmanuale = jeder kann durchf.
- Auswertungsobj. -> zuvor Punktevert., Kriterienmuster festl. (wie wird bewertet?)
- Interpretationsobj. -> Referenzgrößen wie IQ- / t-Werte (Bsp.: wie viele Punkte entspr. einer Note?)
Reliabilität
- Messgenauigkeit (über Messwiederholungen)
Wie genau ist das Messergebnis? Wie stark verändert sich das Ergebnis beispielsweise bei einer Testwiederholung?
- Messwiederholungen führen zu höherer Reliabilität der Messergebnisse
- 100% reliabel = kein Messfehler (gibt es nicht)
- klassische Testtheorie: X = W + F
- beobachteter Wert = wahrer Wert + Messfehler
x1 = w + F1 x2 = w + F2 -> wahrer Wert bleibt gleich, Fehler variiert - Messfehler und Reliabilität sind umgekehrt proportional
- kein Messfehler -> hohe Reliabilität
- Viele Messfehler -> niedrige Reliabilität
Validität
(Gültigkeit, Aussagekraft)
Misst der Test was er messen soll (und nicht noch ein anderes Merkmal)?
- Grad der Gültigkeit mit der ein Merkmal gemessen wird
-Inhaltsvalidität (intern): passt Aufgabenauswahl zum Inhalt?
- Konstruktvalidität / Faktorielle Validität: Test mit einem anderen Test vergleichen
erfasst d. Test Relevantes? -> erfordert ein genau def. Konzept/ Konstrukt (Test 1 m. Test2 -> hohe Korrelation = Konstruktvalidität)
vs.
- Kriteriumsvalidität (extern): Zusammenhang mit anderen externen Kriterien, die ähnliches messen -> hohe Korrelation
(Bsp.: zuvor diagnostizierte Konzentrationsschwäche -> Anwendung des entw. Tests = Übereinstimmung? )
- Augenscheinvalidität: sieht ein Laie auf ersten Blick was gemessen werden soll?
Normierung
Wie gut lässt sich das Testergebnis mit dem Ergebnis anderer Probanden (im selben) Test vergleichen?
Rekonditionierung
Löschung von erlerntem (konditionierten) Verhalten
WISC IV (Leistungstest) - Allg. Merkmale
Wechsler Intelligence Scale for Children IV
(Individualtest)
Allg. Merkmale:
- Untersuchung der kognitiven Entwicklung von 6-16 jährigen
- Eingesetzt in der Päd. und Psych. Diagnostik
- Erfassung d. Gesamt-IQs -> Entwicklungsstand
(Gesamtheit einer Gruppe v. Einzelaspekten)
- weitere IQ-Werte -> die 4 Index-Werte (Sprachverständnis, Arbeitsgedächtnis, wahrnehmungsgebundenes logisches Denken, Verarbeitungsgeschwindigkeit)
- 15 Untertests (10 Kerntests u. 5 opt. Untertests)
HAWIK “Hamburger-Wechsler-Intelligenztest für Kinder-IV” (dt. Version des WISC IV)
- Unterschiede
Unterschiede zum WISC IV:
- nicht mehr in Verbal-IQ u. Handlungs-IQ differenziert
- 4 Indizes -> einzelne IQ-Werte möglich
- 5 neue Untertests
- aktuellere Materialien
- veränderte Abbruchkriterien
- Auswertung differenziert Index- und Untertestebene
WISC IV - Intelligenzkonzept
n. Wechsler:
- Gesamtheit einer Gruppe von Einzelaspekten (keine spezifische Fähigkeit)
- “Fähigkeit des Individuums, zweckvoll zu handeln, vernünftig zu denken und sich mit seiner Umgebung wirkungsvoll auseinanderzusetzen”(Wechsler)
- eine Reihe von Skalen erfassen unterschiedliche geistige Fähigkeiten und spiegeln diese als allg. geistige Begabung des Kindes wieder.
-
WISC IV - Durchführung
- Alter: 6- 16 J.
- Form: Individualtest
- Zeit: abhängig vom Alter und dem Leistungsvermögen (10 Kerntests: 65-90 Min. , Opt. Untertests: 15-20 Min.)
- Pausen bei Müdigkeit erlaubt (max. eine Woche)
- manchmal zeitlich begrenzt
- Ablauf: 10 Kerntests, dann opt. Untertests
- Startregel: Altersentsprechende Aufgaben, Kinder mit Entwicklungsrückständen beim niedrigsten Level
- Umkehrregel: Aufgaben unterhalb des alters-spezifischen Startpunkts
- Abbruchregel: nach einer bestimmten Anzahl von aufeinanderfolgenden Aufgaben mit 0 Punkten -> Abbruch
- Übungsaufgaben: vertraut werden mit den Aufg.
WISC IV - Auswertung (unwichtig)
- Rohwertsummen der einzelnen Untertests berechnen
- Rohwerte in Punktwerte, unter Berücksichtigung des Alters, umrechnen
- Index-Werte und der Gesamt-IQ berechnen -> dann aus d. Tabelle abgeleitet
- Ergebnisse werden graphisch dargestellt (Index u. IQ)
WISC IV - Gütekriterien
Normen:
-2600 Probanden (DE, CH, AT )
- Normstichprobe
Objektivität:
- Handbuch -> Durchführungsobjektivität
- standardisierte Auswertung -> detaillierte Listen vorgegeben
Reliabilität:
- Messgenauigkeit -> mit Hilfe der Split-Half-Methode berechnet (Rohwertsummen der Untertests korreliert)
Validität:
- Interkorrelationsstudien: (sehr) hohe Korrelationen der 4 Indizes
- Konstruktvalidität: Bestimmung der 4 eigenst. Index-Werte + psy. Interpretation gelten als emp. abgesichert -> belegt die Faktorenanalyse
- Kriteriumsvalidität -> umfassend bestätigt
prädiktiv (valide)
vorhersehbar, prognostizierbar (gültig, zuverlässig)
Aufgabentypen
Testentwicklung
- freies Antwortformat: Kurzaufsatz, Ergänzungsaufg.
- gebundenes Antwortformat: Ordnungs-, Auswahl-, Beurteilungsaufgaben
- atypisches Antwortformat (=alle anderen Aufgabenformate, z. B. Zahlen verbinden)
I-S-T 2000 R
Intelligenz-Struktur-Test (atypisches Antwortformat)
Aufgabenkonstruktion
- keine mehrdeutigen Begriffe verwenden
- Begriffe/Formulierungen -> für alle zugänglich?!
- pro Item -> nur einen sachl. Inhalt
- keine doppelten Verneinungen (“Ich bin nicht leicht beunruhigt.”)
- Verallgemeinerungen vermeiden (“Alle K. machen Lärm.”)
- umständlich lange Wörter vermeiden (Friedensbewegungsbefürworter)
- Abkürzungen vermeiden (U. U. es es m. E. ….)
- Wichtiges hervorheben (fett, unterstr.)
- Zeitpunkt, Zeitspanne -> eindeutig def.
Itembias (erkennen)
- bias = Störfaktor
- Antwort-bias = system. Fehler beim Messen
- > beeinflusst alle Messungen gleich (verstärkender/ vermindernder Effekt)
- ein biasfreier Item = Wahrscheinlichkeit Item zu lösen ist für alle mit gl. Fähigkeit aus derselben Untergr. gleich
Valititätskoeffizenten
(sind in der Regel) Korrelationen
Itemschwierigkeit (pi)
- wie viele Pers. lösen die Aufg. richtig in Abhängigkeit der Gesamtheit?
- pi = n richtig / n gesamt x 100 (je gr. das Ergebnis, desto leichter die Aufg.)
=> kl. Wert -> hohe Itemschwierigkeit!
Itemtrennschärfe (r it)
-> Diskriminierungsfähigkeit
- Fähigk., die Leistungen der Probanden zu trennen (Fähigen v. Unfähigen)
Item = i
Gesamttestwert = t
r it = Korrelation (i, t)
(r it > 0,3 = gut)
Part-whole-Korrektur der Trennschärfe
Überschätzung der Trennschärfe, weil das Item selbst Teil der Skala ist
- Korrektur -> Item von der Gesamtheit abziehen