Validitet Flashcards
Validitet
Ett tests förmåga att (i en given population) mäta det som testet avser att mäta. Mäter du något som inte avser rätt enhet så får du låg validitet, dåligt. Mäter du något som avser rätt får du hög validitet. Är inte en egenskap hos testet i sig utan avgörs i relation till den testade populationen.
Innehållsvaliditet (content)
Hur innehållet i frågor relaterar till syftet med testet, avgörs ofta kvalitativt.
Ytvaliditet (face)
Testet uppfatts rimligt i förhållande till sitt syfte, hur respondenterna uppfattar frågorna, om de tar dem seriöst.
Kriterievaliditet (criterion)
Undersöks empiriskt.
Samtidig validitet (concurrent)
Korrelation med annat test eller bedömning av samma fenomen som görs vid samma tidpunkt.
Prediktiv validitet (predictive)
Korrelation mellan testet med ett kriterie som föreligger först vid senare tillfälle. Hur relaterar testet till andra test, något yttre/ett kriterium som man sätter upp.
Begreppsvaliditet (construct)
I vilken mån testet kan sägas mäta en teoretiskt definierad psykisk dimension. Undersöks genom att visa på samband med andra mått eller med hjälp av faktoranalys.
Samband med andra mått, syftet är att förankra det i en teori.
Intern validitet
I vilken utsträckning den oberoende variabeln (och ingenting annat) påverkar beroende variabeln (utfallet, de uppnådda resultaten).
Extern validitet
I vilken utsträckning resultaten kan generaliseras till andra individer, miljöer, situationer (förhållanden)?
Validitet för testinstrument
Observationer och resultat i studier som verifierar instrumentets effektivitet vid diagnos och prognos
Hur påverkar reliabilitet validitet?
Hög reliabilitet är en förutsättning för empirisk validitet och reliabiliteten sätter en övre gräns för testets möjliga validitet.
Hur undersöker man ett tests validitet?
Genom korrelationer, faktoranalys och regressionsanalys. Validiteten kan bestämmas genom studier av all systematisk och vetenskaplig evidens för testets tillförlitlighet. Dock enbart uppskattningar.
Validitetskoefficienten
Validitetskoefficienten, rxy är korrelationen mellan ett testresultat och ett lämpligt kriterium som man kan validera testet emot, t.ex. ett ”goldstandard” test (begreppsvaliditet) eller ett mätbart kriterium på utfall (prediktiv validitet). Mindre urval ger lägre validitet och lägre koefficienter.
Determinationskoefficienten
Determinations-koefficienten anger hur stor del av variationen (mellan individer) i den beroende variabeln (y) som kan förklaras av att individerna har olika värden på den oberoende variabeln (x). rxy 2 anger proportionen förklarad varians i förhållande till total varians.
Att undersöka begreppsvaliditet
Mäter testet de dimensioner som domänen/konstruktet/begreppet har i enlighet med vår teori? Korrelation beräknas mellan index-test och referens-test. (test som ansågs mäta begreppet). Kan även undersökas med faktoranalys. Det är en viktig del av undersökningen av ett tests validitet och ett verktyg i utvecklingen av test.
Faktoranalys
Bestämmer funktionella relationer mellan variabler. Analysen tar hänsyn till graden av gemensam information i variablerna och innebär att man förklarar strukturen i ett material, var det finns höga faktorladdingar - grupperar sig frågorna och kan man hitta en struktur mellan olika frågor. Testkonstruktören har en viktig del i att finna de faktorer som är teoretiskt meningsfulla.
Faktorladdningar
En gruppering av frågor. Grupperar sig frågorna på något sätt?
Principalkomponentanalys (PCA)
Används ofta som första steg i faktoranalys och som en deskriptiv metod för att ta fram oberoende (ortogonala) komponenter. Varje komponent innehåller variabler med så stor förklarad varians som möjligt samtidigt som ortogonal mot tidigare komponenter. Handlar om gemensam/delad varians och unik varians.
Explorativ faktoranalys (EFA)
Använder bara gemensam/Delad varians. Ett underlag för reduktion av item med oklar faktortillhörighet och är en indikation på att fler variabler behövs inom “liten” faktor. (se bild)
Konfirmatorisk faktoranalys (CFA)
Testar hypotes om struktur – var höga laddningar mellan faktorer ska förekomma, dvs vilka variabler som är indikatorer på vilka faktorer. Bygger på SEM - strukturell ekvationsmodellering (se bild)
Exempel på faktoranalyser
Wechslers intelligensskalor (WAIS) = Faktoranalytiska metoder har tydliggjort hur de olika deltestenförhåller sig till varandra. Genom att undersöka begreppsvaliditeten på detta sätt kan vi idag uttala oss om olika kognitiva funktioner
Personlighetstest (NEO-PI) = Det är en lång faktoranalytisk tradition som har utmynnat i femfaktormodellen
Modellen bygger på ett stort antal test och forskningsstudier.
Att konstruera ett test
- Analys av fenomenet: beskrivning från olika perspektiv av det fenomen som man vill mäta
- Konstruktion av testitems: fenomenet omsätts till konkreta testitems med en lämplig svarsskala. Pröva på ett litet bekvämlighetsurval för synpunker på formulering
- Itemstatistik: undersök svarsfördelning på enskilda items – har hela skalan (range) använts? Är fördelningarna symmetriska eller sneda? Fortsatta beräkningar förutsätter symmetriska fördelningar.
- Samband mellan testitems: beräkning av reliabilitet, faktoranalys, logistisk itemanalys (IRT). Hittar de items som behöver tas bort.
- Summavariabeln: när man får fram tillfredställande reliabilitet mätt med ex Cronbachs alpha, kan skalan anses vara tillförlitlig.
- Validitet, finns inga entydiga regler
- Korsvalidering – pröva reliabilitet i två eller fler sample
- Begreppsvaliditet – har eller saknar testet samband med andra test
- Samtidig eller prognostisk validitet – finns samband med kriterium nu eller i framtiden
- Inkrementell validitet – visa att det nya testet ökar validitet i bedömning
Vilken skala ska man välja?
Lämpligt antal steg?
Jämt eller ojämnt antal?
Ankarvärden eller värden på alla skalsteg?
Ska det neutrala värdet vara i mitten på skalan?
Spelar siffrorna någon roll?
Ska man vända ordningen på några item?
Påverkar frågor varandra?
Frågor att undvika
Ledande frågor
Tvetydiga frågor
Fler frågor i samma fråga
Frågor som förutsätter speciell kunskap
Krångligt språk
Långa frågor med flera led/ komplexa frågor
Nedlåtande frågor
Negationer