Arbeitsmittel P. Diagnostizierens & Theoretische Grundlagen Flashcards by Anton Freund

Aktuelle Intelligenztheorien:

Nach CATTELL (und in der Folge Horn) geht es um Fluid vs. Crystallized Intelligence.
Nach GUILDFORD um dessen „Produkte“, insbesondere Klassen, Beziehungen und Implikationen. Nach JÄGER geht es um die Materialien: verbal, numerisch und figural
-> Betrachtet man die Erstauflage des IST aus 1955, so ist die Orientierung an THURSTONE offensichtlich:
Verbal Comprehension, Word Fluency, Number, Space, Memory, Reasoning, Perceptual Speed…

In der Differenziellen Psychologiegilt heute die CATTELL-HORN-CARROLL (CHC)-Theorie als allgemein anerkannt (auch „Carroll’s Three-Stratum-Theory“ bezeichnet). CATTELL „teilte“ die Allgemeine Intelligenz wie SPEARMAN in 2 allgemeine Intelligenzen, Fluid und Crystallized Intelligence; sein Schüler HORN ergänze
diese beiden Komponenten um weitere „broad abilities“. Carroll erweiterte die beiden hierarchischen Ebenen um eine 3. Ebene, „stratum III“.

How well did you know this?

Not at all

Perfectly

Explizit der CHC-Theorie folgen nur:

IDS-2: Intelligence and developmental scales – Intelligenz- und Entwicklungsskalen für Kinder und
Jugendliche
KABC-II: Kaufman Assessment Battery for Children II, deutschsprachige Adaption

How well did you know this?

Not at all

Perfectly

Wenn es ebendort heißt “Faktorenanalytisch annähernd konstruktvalidiert” ist einiges zu bedenken:

-> es weisen die beiden hauptsächlich zu interpretieren empfohlenen Testkennwerte kaum Bezug zur CHC-Theorie auf -> wenig verwunderlich, weil beide ursprünglich auf ganz andere Intelligenzkonzepte zurückgehen (IDS-2 auf “Kramer-Test”, auf BINET-SIMON; KABC-II auf WECHSLER). Damit gehen die Tests auf eine pragmatische intelligenztheoretische Position zurück: „gemessen wird, was zu messen geht“.

Auch: Die Faktorenanalytisch basierten Theorien „stehen und fallen“ mit den Problemen dieser Methode: es handelt sich um ein nicht-prüfbares Modell + die hohe „Stichprobenabhängigkeit“ der Methode macht es sehr wahrscheinlich, dass gewonnene empirische Ergebnisse nicht universell gelten.

How well did you know this?

Not at all

Perfectly

Projektive Verfahren:

sind eine Gruppe von psychologischen Techniken und Vorgehensweisen, die für sich
in Anspruch nehmen, die grundlegende (verborgene) Persönlichkeitsstruktur und die Motive eines
Individuums aufzudecken, indem sie das Individuum auffordern, sich mit Material oder Stimuli
auseinanderzusetzen oder auf sie zu reagieren in einer freien, nicht festgelegten Weise.

Etwa um die Jahrhundertwende wurde mit dem Ausdruck Projektion die Tendenz eines Individuums bezeichnet, „einer anderen Person eigene Gefühle, Gedanken oder Einstellungen zuzuschreiben oder in gewisser Weise die äußere Wirklichkeit als Repräsentanz solcher Gefühle zu betrachten.“
-> Allein der Begriff „Projektion“ (Freud) macht den Bezug zur Psychoanalyse (Tiefenpsychologie)
offensichtlich. Da es dabei um Unbewusstes geht, verschließt sich dieser Ansatz einer Theorie dem
empirisch belegbaren Zugang.
Im Übrigen ist zu fragen, ob die Psychoanalyse Thema der Differenziellen Psychologie oder der
Allgemeinen Psychologie ist.

How well did you know this?

Not at all

Perfectly

GÜTEKRITERIEN

Innerhalb der psychologischen Testtheorie wurden 2 verschiedene Ansätze entwickelt. Der jüngere Ansatz basiert auf der „Item-Response-Theorie“ (IRT), im Wesentlichen geprägt durch G. RASCH. Demgegenüber gibt es die als „Klassische Testtheorie“ bezeichnete ursprüngliche Testkonstruktionstheorie (begründet
durch GULLIKSEN; deutschsprachig beeinflusst durch LIENERT).

How well did you know this?

Not at all

Perfectly

Übersicht Gütekriterien:

- Objektivität
- Reliabilität
- Validität
- Eichung
- Skalierung
- Ökonomie
- Nützlichkeit
- Zumutbarkeit
- Unverfälschbarkeit
- Fairness

How well did you know this?

Not at all

Perfectly

OBJEKTIVITÄT

Unter Objektivität eines Tests ist zu verstehen, dass die mit ihm gewonnenen Ergebnisse unabhängig vom Untersucher sind.

Als Untersucher ist dabei vor allem der Testleiter (Tl) gemeint, aber auch der Auswerter, der die
beobachteten Testreaktionen zu Testwerten verrechnet, sowie diejenige Person, welche die Testwerte bewertet/interpretiert. Spätestens die letztgenannte Person ist regelmäßig der Psychologe.
-> Durchführung, Auswertung und Interpretation können von jeweils anderen Personen geleistet werden.

How well did you know this?

Not at all

Perfectly

Testleiterunabhängigkeit

Testleiterunabhängigkeit ist gegeben, wenn das Testverhalten der Tp und damit ihr Testergebnis
unabhängig ist von zufälligen oder systematischen Verhaltensvariationen aller denkbaren Tl.

How well did you know this?

Not at all

Perfectly

Halo-Effekts

Tendenz, sich bei der Beurteilung einer Persönlichkeitseigenschaft von
einem Gesamteindruck oder einer hervorstechenden Eigenschaft leiten zu lassen

How well did you know this?

Not at all

Perfectly

ROSENTHAL-Effekt

-> Experimente von ROSENTHAL, in denen infolge manipulierter Einstellungen der „Lehrer“ 2 grundsätzlich
gleiche Gruppen von Versuchsobjekten zu unterschiedlichen Leistungen gelangten (sog. ROSENTHAL-Effekt).

How well did you know this?

Not at all

Perfectly

Studie von PREUSCHE zu geschlechtsspezifischen Tl-Effekten:

Zeigte, dass leistungsschwache Mädchen, die
von männlichen Tl getestet wurden, im Vergleich zu leistungsschwachen Mädchen, die von einem
weiblichen Tl getestet wurden, im Durchschnitt einen deutlich besseren Testwert erreichten. D.h. das Geschlecht der Tp, nämlich im Fall weiblich, beeinflusst den Tl je nach seinem eigenen Geschlecht anders, so dass letztlich ein anderes Testergebnis für die Tp resultiert.

How well did you know this?

Not at all

Perfectly

Auswertungsfehler sind ein „No-go“ – dürfen einfach nicht passieren.

Am Bsp. studentischer
Gutachten -> Test d2: knapp 50% machten Fehler beim Auszählen mittels Schablone, 40% ordneten in
der Eichtabelle einen falschen Wert zu, 30% machten Rechenfehler (beim Summieren) -> daher sind
Verfahren vorzuziehen, die auch ein Auswertungsprogramm anbieten.

How well did you know this?

Not at all

Perfectly

RELIABILITÄT

= eine nichts sagende Bezeichnung; besser, weil es darum geht: Messgenauigkeit
Mit Messgenauigkeit eines Tests ist zu verstehen, dass die mit ihm gewonnenen Erkenntnisse präzise
sind, d.h. ohne Fehler der Merkmalserfassung -> es interessiert uns das Ausmaß der Messgenauigkeit.

How well did you know this?

Not at all

Perfectly

ZUr Messgenauigkeit:

Innerhalb der psychologischen Testtheorie gibt es 2 verschiedene Ansätze: KTT und IRT.

Die IRT erklärt mit Hilfe bestimmter mathematischer (genauer: wahrscheinlichkeitstheorierischer) Funktionen das Zustandekommen der Reaktion (Antwort) einer TP auf ein Item. Anders als die KTT fokussiert sie auf die einzelnen Items, nicht auf den Test als solchen.

How well did you know this?

Not at all

Perfectly

MESSGENAUIGKEIT LAUT IRT

Die IRT setzt in einer mathematischen Gleichung („Modell“) für jede Person und jedes Item eines Tests (mind.) 1 Parameter an. In diese Gleichung geht auch die beobachtete Leistung je Person ein, z.B. ob eine Aufgabe gelöst wird. Modelliert, d.h. angenommen wird, wie genau für diese Leistung die eben nicht direkt beobachtbare Fähigkeit der Person (mit-)verantwortlich ist. Anhand der beobachteten Leistungen bei allen vorgegebenen Aufgaben kann aus dieser Gleichung der unbekannte, also gesuchte Fähigkeitsparameter der untersuchten Person geschätzt werden.

Aus der Statistik ist bekannt, wie man für jede Parameterschätzung auch den dabei möglichen Schätzfehler bestimmt; genauer: wie und mit welcher Varianz sich diese verteilen. Ist der Messfehler sehr klein, dann hat der verwendete Test (für die betreffende Person) eine hohe Messgenauigkeit; ist er groß -> geringe Messgenauigkeit (das erhaltene Testergebnis kann hochgradig falsch sein).

How well did you know this?

Not at all

Perfectly

MESSGENAUIGKEIT laut KTT

Study These Flashcards

Die KTT orientiert sich an der Idee der Reproduzierbarkeit der Testwerte. Sie sucht dabei verschiedene methodische Auswege, die eine Testwiederholung umgehen. Grundsätzlich bedient sie sich der Methode der Korrelationsrechnung.

Üblicher Ansatz: „Innere Konsistenz“ -> Die Teile eines Tests sollen durchgängig dasselbe messen! Split- Half-Methode („Testhalbierungsmethode“): Hier werden die Testitems in 2 Teile geteilt und die
resultierenden Testwerte beider Teile korreliert. Der Testanwender hat damit nichts zu; Er kann davon ausgehen, dass immer dann, wenn in einem Manual von Split-Halft-Reliabilität gesprochen wird, bereits entsprechend der genannten Formel korrigiert wurde.

Viele Praktiker bewerten die Höhe des Reliabilitätskoeffizienten ziemlich intuitiv hinsichtlich seiner Nähe zu 1.

Study These Flashcards

Dabei missachten sie, dass nicht die absolute Differenz zu 1, sondern die Differenz des Quadrats des Reliabilitätskoeffizienten von 1 bedeutend ist -> r von 90 bedeutet, dass 81% der Variabilität (Varianz) der Testwerte in der einen Testhälfte durch die Variabilität der Testwerte in der zweiten Testhälfte erklärt werden, d.h. aber, dass fast 20% der Variabilität der Testwerte in den beiden Testteilen nicht wechselseitig erklärt werden kann, sondern von (Mess-)Fehlern bestimmt wird. r = 80 ist nicht „ein wenig niedriger“ sondern spricht mit 36% durch (Mess-)Fehler bedingte Variabilität deutlich gegen eine ausreichende Messgenauigkeit.

Aus den Axiomen der KTT lässt sich der Standardmessfehler (SMF) wie folgt herleiten:

Study These Flashcards

Schulmäßig sind vom Praktiker die gewonnen Testergebnisse vor der Interpretation stets mittels
Konfidenzintervalls in Bezug auf die einzukalkulierende Messungenauigkeit abzusichern.

Validität

Study These Flashcards

Unter Validität eines Tests ist zu verstehen, dass er tatäschlich jenes psychisches Merkmal misst, welches er zu messen vorgibt.

Eigentlich ist die Validität das wichtigste Gütekriterium, d.h. eine nachweislich nicht gegebene Validität schließt definitiv die Brauchbarkeit eines Verfahrens aus. Grundvoraussetzung für die Validität eines psychologisch-diagnostischen Verfahrens ist, dass dieses eine so genannte Sinnhaftigkeitsprüfung besteht.

Study These Flashcards

Dabei muss der Testautor systematisch analysieren, inwieweit die resultierenden Testwerte grundsätzlich sinnvoll sind, d.h. in Richtung der zu messen intendierten Eigenschaft interpretiert werden können – und nicht auf bestimmte unerwünschte Einflüsse zurückgeführt werden müssen. Solche Einflüsse sind v. a.:

- Alle denkbaren Antwortstrategien (taktierende Verhaltensweisen) einer Tp
- Alle denkbaren Missachtungen der Instruktion seitens der TP
- Alle untypischen Fehlinterpretationen der Instruktion seitens der Tp
- Alle untypischen Aktionen oder Reaktionen der Tp am Beginn (oder am Ende) der Testung

Der Testkonstrukteur sollte mit einer Sinnhaftigkeitsprüfung gewährleisten, dass die resultierenden Testwerte vom Diagnostiker inhaltlich richtig interpretiert werden. Der Diagnostiker sollte sich darauf aber nicht verlassen!

Study These Flashcards

Simple Sinnhaftigkeitsprüfungen sollte daher der Diagnostiker selbst durchführen:
Nämlich diverse Antworttendenzen nachahmen – z.B. immer die 2. Antwortmöglichkeiten bei MC-Items
wählen oder die Auswahl der Antwortmöglichkeit gemäß einem bestimmten Muster abwechseln (Bsp.: IST2000 R -> immer 2. Antwort -> gemäß Eichtabelle Z=98, d.h. IQ=100).

Exkurs: Distraktoren (=Ablenker).

Study These Flashcards

Ihre Aufgabe ist es, eine nicht lösungskompetente Tp von der Lösung abzulenken, insb. dadurch, dass er aus teilweise richtigen Komponenten besteht, so dass er der Lösung möglichst nahekommt. So gesehen ist ein Distraktor dann brauchbar, wenn er die Tp „verwirrt“, wodurch nur ausreichend befähigte Tpn zur Lösung gelangen. Natürlich kann der Anwender die Qualität der Distraktoren von Tests nicht selbst prüfen. Er sollte aber im Manual Infos dazu suchen: Distraktoren sind nur gut, wenn sie je Aufgabe jeweils alle in der Eichstichprobe annähernd gleich oft gewählt wurden. Wird nämlich einer sehr häufig, vllt. sogar häufiger als die Lösung gewählt, sp spricht das für eine irreführende Aufgabengestaltung. Wird ein Distraktor hingegen so gut wie nie gewählt, dann scheint er auch sehr leistungsschwachen Tpn absurd.

Erläuterung zum Begriff „Validität“ laut Standards for Educational and Psychological Testing

Study These Flashcards

“Validity refers to the degree to which evidence and theory supports the interpretation of test scores for proposed uses of tests” -> Es ist daher inkorrekt von einer “Validität des Tests” zu sprechen; besser: von der Validität der Interpretationen des Tests.

inhaltlicher Gültigkeit

Study These Flashcards

Von inhaltlicher Gültigkeit ist zu sprechen, wenn ein Test definitionsgemäß das interessierende Merkmal
erfasst.

Regelgeleitete Itemkonstruktion:

Bei der Konstruktion der einzelnen Items eines Tests werden ganz bestimmte, definitorisch festgelegte Regeln angewendet, z.B. beim WMT-2 führt nur die richtige Anwendung dieser Regeln zur Lösung à leider gibt es nur selten regelgeleitete Itemkonstruktion. Für Diagnostiker wichtig: Solche Tests sind vorzuziehen, weil „offensichtlich“ ist, was sie messen!

Am besten erreicht man inhaltliche Gültigkeit durch ein Expertenrating. Hierbei wird jedes einzelne Item dahingehend geprüft, ob es in Bezug auf die Operationalisierung dessen, was der Test messen soll, passt. Dabei ergibt sich aber oft das Problem, was genau die Qualifikation zum Experten ausmacht bzw. wie repräsentativ die Auswahl der Experten ist. Spannungsverhältnis: Der Testkonstrukteur behauptet, die geeigneten Experten ausgewählt zu haben, der Diagnostiker kann es glauben… oder auch nicht. Vom Expertenrating abgesehen gibt es noch andere Ansätze, um inhaltliche Gültigkeit festzulegen:

1) Extremgruppenvalidierung: Getestet werden diejenigen beiden Personengruppen, von denen erwartet wird, dass sie sich im fraglichen Merkmal deutlich unterscheiden. 2) Change-Ansatz: Die Aufgaben werden in der Konstruktionsphase eines Tests systematisch so variiert, dass eine höhere bzw. geringere Schwierigkeit zu erwarten ist; und dies wird untersucht (z.B. AID 3 statt „Nenne mir ein Tier, das Milch gibt“ nun „Kühe und Ziegen geben uns Milch; welches Tier noch?“) 3) Methode des lauten Denkens (während der Testbearbeitung): so wird überprüft, ob tatsächlich das intendierte Konstrukt erfasst wird. Ausschließlich zu Zwecken eines wissenschaftlichen Erkenntnisgewinns soll dabei die an einem Problem arbeitende Person alle ihre aufkommenden Gedanken und Einfälle im Laufe des Lösungsprozesses unreflektiert äußern. 4) Evaluation diagnosespezifischer Förderung: Oft gibt es je Diagnose die Notwendigkeit eines speziellen Therapie-/Trainings-/Förderprogramms. Solche Programme sollten nur bei denjenigen Personen großen Erfolg zeigen, für die sie gedacht sind.

Spannungsfeld Testkonstrukteur vs. Diagnostiker:

Dem Diagnostiker fehlen Belege zur inhaltlichen Gültigkeit wesentlich häufiger als sie dort tatsächlich vorliegen. Oft fragt sich der Diagnostiker: „Hat der Konstrukteur z.B. Methode des lauten Denkens angewandt?“ oder „Warum hat der Konstrukteur die inhaltliche Validität nicht mittels des Change-Ansatzes überprüft?“

Augenscheinvalidität (face-validity

Augenscheinvalidität (face-validity) bedeutet, dass es der Tp augenscheinlich klar ist, was mit dem Test zu messen beabsichtigt wird; sie durchschaut die Messintention. Augenscheinvalidität bedeutet nicht, dass der Test augenscheinlich valide ist.

ökologische Validität

Unter ökologischer Validität versteht man, dass das psychologische Diagnostizieren den Anforderungen der „natürlichen Lebensbedingungen“ entspricht. Es geht also um die Beschreibung und „Funktionsanalyse“ des Menschen unter seinen natürlichen Alltagsbedingungen.

Kriteriumsvalidität

Ein Test besitzt dann Kriteriumsvalidität, wenn das von ihm erfasste Merkmal ein relevantes (in Zukunft liegendes) Kriterium richtig vorherzusagen imstande ist -\> **Prognostische Validität**. Sie wird ermittelt mittels Korrelationskoeffizienten: „… inwieweit die Relation der Testwerte, der untersuchten Person mit den Relationen der erzielten Merkmalsausprägungen im fraglichen Kriterium übereinstimmen.

Arbeitsmittel P. Diagnostizierens & Theoretische Grundlagen Flashcards

(31 cards)