Wyklad 3 Flashcards
Założenia testów
• Cechy istnieją (przeciwnie uważał W. Mischel) • Cesze odpowiada kontinuum, na którym można rozmieścić badane osoby zgodnie z wartością (natężeniem) tej cechy • Względna stałość czasowa cechy • Względna stałość sytuacyjna cechy • Ekwiwalentność odpowiedzi testowych • Reprezentatywność próbki zachowań • Adekwatność autopercepcji
Założenia klasycznej teorii testu
Gulliksen, 1950
do psychologii można zaadaptować model pomiaru
pochodzący z fizyki
• podobnie jak każdy obiekt fizyczny ma określone
wartości swoich cech fizycznych, niezależne od aktu
pomiaru i natury narzędzia badawczego, tak każdy
człowiek ma nieznane prawdziwe wartości cech
psychologicznych
• podczas pomiaru obserwujemy wartości prawdziwe
mierzonej cechy, zakłócone błędem równym różnicy
miedzy obserwowaną wartością wyniku pomiaru a
nieobserwowalną wartością prawdziwą mierzonej cechy
Rzetelność
• Rzetelność jest miarą dokładności pomiaru
• Rzetelność = powtarzalność (przy założeniu
stałości cechy)
Wzór na wynik otrzymany
Xt = X + Xe, gdzie: Xt: wynik otrzymany X: wynik prawdziwy Xe: składnik błędu
Wynik prawdziwy
Gulliksen, 1950
• Wynik prawdziwy to granica, do jakiej
zmierza przeciętna wyników i-tej osoby w
danej liczbie testów równoległych, jeśli ta
liczba wzrasta nieograniczenie
• średnia z nieskończenie wielu badań tym
samym testem
• wynik danej osoby otrzymany w idealnych
warunkach idealnym narzędziem
pomiarowym
Składnik błędu (Guilford, 1954)
• różnica między wynikiem prawdziwym a wynikiem otrzymanym • wartość dodatnia lub ujemna będąca funkcją warunków testowania konkretnej osoby w konkretnym badaniu
Założenia klasycznej teorii testów (te bardzo psychometryczne)
• Średnia arytmetyczna błędów wynosi zero
• Korelacja wyniku prawdziwego i składnika
błędu jest zerowa
• Korelacja składników błędu dwóch testów
równoległych (czyli dwóch kolejnych
pomiarów) jest zerowa
• Korelacja składników błędu w teście i
reteście tym samym testem jest zerowa
• Z założenia o istnieniu wyniku
prawdziwego, niezależnego od aktu
pomiaru, oraz z założenia o losowości
błędów, wynika, że:
– idealne narzędzie badawcze powinno w
dwóch kolejnych pomiarach przynieść takie
same wyniki
Długość testu a jego rzetelność
• Im dłuższy test (im więcej pozycji zawiera)
tym jest rzetelniejszy, to jest, tym
mniejszym jest obciążony błędem
• Im więcej składowych znajduje się w teście,
tym bliższy jest on wynikowi prawdziwemu
na mocy definicji stwierdzającej, że wynik
prawdziwy to średnia z nieskończenie wielu
testów równoległych
Krytyka aksjomatyki Gulliksena
• Thorndike (1964): ponieważ wyniki prawdziwe
nie są mierzalne bezpośrednio, są one mitem i
nie mogą mieć znaczenia teoretycznego
– przyjęcie tego poglądu odrzucałoby całą statystykę
inferencyjną, która dotyczy głównie szacowania
nieobserwowalnych parametrów
– wyniki prawdziwe nie są mierzalne bezpośrednio, ale
są szacowalne, z błędem nie wykluczającym
teoretycznej ani praktycznej użyteczności
• Poważniejszy zarzut (Lord i Novick, 1968):
nieweryfikowalność założenia o losowości
błędu pomiaru, czyli postulatu, że średni
błąd wynosi zero. Stopień prawdziwości
tego założenia nie jest szacowalny (w
przeciwieństwie do nieobserwowalnych
parametrów)