H4: Itemconstructie Flashcards

1
Q

Wat is een item?

A

Een item is een stimulus waarop de respondent reageert (p. 117).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat is de definitie van itemreacties?

A

Het geobserveerde gedrag

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat wordt uit de itemreacties afgeleid?

A

Het niveau van de geteste persoon af te leiden op een niet-observeerbare psychologische eigenschap die verondersteld wordt ten grondslag te liggen aan deze reacties.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Op welke manieren kan er onderscheid gemaakt worden tussen de items? 3x

A
  1. Van de respondenten gevraagde activiteit, zoals:
    - theoretische opdrachten
    - stellingen over de eigen persoonlijkheid of significante anderen
    - vragen
    - praktijkproeven
  2. Antwoordvorm, zoals:
    - open vragen
    - gesloten vragen
  3. Uiterlijke verschijningsvorm, zoals:
    - meerkeuzevragen
    - rating scales
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welke 2 antwoordvormen zijn er?

A
  1. Open vraag (=opdracht of essayvorm)
  2. Gesloten vraag (=geprecodeerd, multiplechoice of meerkeuze)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Waarom is het noodzakelijk om de reacties van respondenten te kwantificeren?

A

Voor systematisch onderzoek naar de kwaliteit van de items en van de test of vragenlijst als geheel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat is een belangrijk criterium bij het kwantificeren van de reacties van respondenten?

A

Rangordening: de rangorde in de getallen die worden toegekend moet corresponderen met de psychologische werkelijkheid. Iemand met een score ‘3’ op een rating scale moet in werkelijkheid een hogere positie innemen op de psychologische eigenschap die wordt gemeten, dan iemand die een ‘2’ scoort op de rating scale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hoe noemen we de basiselementen waar psychologische tests en vragenlijsten uit bestaan?

A

De basiselementen zijn de items (p. 117).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Noem minimaal twee voorbeelden van theoretische opdrachten.

A

Voorbeelden van theoretische opdrachten zijn de volgende opdrachten: vind de weg door het doolhof, maak deze figuur na met de blokken, draai deze figuur in gedachten naar links (p. 117).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat wordt vaak met behulp van theoretische opdrachten gemeten?

A

Met behulp van theoretische opdrachten worden cognitieve capaciteiten en vaardigheden gemeten (p. 117).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat wordt verstaan onder capaciteiten?

A

Capaciteiten zijn mentale vermogens met een duidelijk erfelijke component (p. 117).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Noem een voorbeeld van een stelling in een psychologische test.

A

Een voorbeeld van een stelling in een psychologische test is: ‘Ik ben vaak aan het woord tijdens een receptie.’ (p. 118).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat kunnen we met stellingen meten?

A

Met stellingen kunnen we persoonlijkheidstrekken, opinies, attitudes en voorkeuren meten (p. 118).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Kunnen antwoorden op stellingen goed of fout zijn?

A

Antwoorden op stellingen kunnen niet goed of fout zijn, ze geven de positie van de respondent aan op de schaal van de veronderstelde eigenschap (p. 118)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat is de bedoeling van praktijkproeven zoals het simuleren van treinverkeer?

A

De bedoeling van praktijkproeven is om te onderzoeken of iemand complexe situaties snel kan overzien (p. 118).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

In hoeveel categorieën kunnen de reacties van respondenten grofweg worden onderscheiden?

A

De reacties van respondenten kunnen grofweg worden onderscheiden in twee categorieën. Namelijk de respondent bepaalt zelf hoe hij reageert en de respondent kiest uit een aantal geformuleerde reacties (p. 119).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Geef andere namen voor de gesloten-vraagvorm.

A

Andere namen voor de gesloten-vraagvorm zijn geprecodeerde vraagvorm, multiplechoicevraagvorm, meerkeuzevraagvorm (p. 119).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Waarom wordt er gedacht dat de open-vraagvorm superieur is aan de meerkeuzevraagvorm?

A

Er wordt door sommigen gedacht dat de open-vraagvorm superieur is aan de meerkeuzevraagvorm. De reden hiervoor is dat open vragen aan de respondent de mogelijkheid bieden te laten zien wat hij weet of kan, dat hij creatief is, dat hij blijk kan geven van meer dan alleen de direct gevraagde kennis en van diepere inzichten (p. 119).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Welke problemen doen zich voor bij het interpreteren en categoriseren van het antwoord van de respondent op een open vraag? 3x

A
  1. Het is tijdrovend.
  2. Respondenten begrijpen niet altijd wat er met de vraag wordt bedoeld.
  3. Niet alle respondenten zijn in staat hun gedachten op papier te zetten.
    (p. 120).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Wanneer verdienen open vragen of opdrachten de voorkeur boven meerkeuzevragen?

A

Open vragen of opdrachten verdienen de voorkeur boven meerkeuzevragen bij metingen van creatieve taalvaardigheid, bij schriftelijke uitdrukkingsvaardigheid (p. 123).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Waarom is het verstandig om bij testconstructie de categorisering van de reacties door minimaal twee beoordelaars te laten geschieden?

A

Het is verstandig om bij testconstructie de categorisering van de reacties door minimaal twee beoordelaars te laten geschieden om subjectiviteit van de beoordeling beter te kunnen uitsluiten (p. 123).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Hoe worden items genoemd met ten minste drie antwoordcategorieën?

A

Items met ten minste drie antwoordcategorieën worden polytome items genoemd (p. 134).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Ligt er aan vaardigheden ook een erfelijke component ten grondslag?

A

Ja, maar ze zijn voor een groot deel aan te leren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Wat wordt er met ‘vragen’ gemeten?
(Valt onder ‘van de respondent gevraagde activiteit)

A

Opnies, houdingen en voorkeuren

25
Q

Zijn antwoorden op ‘vragen’ goed of fout?

A

Antwoorden op vragen kunnen niet goed of fout zijn, maar ze geven en standpunt of houding aan

26
Q

Wat wordt er bij praktijkproeven gemeten?

A

Capaciteiten of vaardigheden dmv arbeidsproef.
Reacties kWunnen diverse vormen aannemen.

27
Q

Wat zijn de voordelen van een rating scale item? 3x

A
  1. Beantwoording gaat snel, waardoor je meer vragen kan stellen > meer informatie > hogere betrouwbaarheid > betere dekking van bedoelde eigenschap > betere validiteit
  2. Geen gelegenheid om op voor het onderzoek irrelevante zaken in te gaan en de kans op het verkeerd begrijpen van de stelling is kleiner
  3. Interpretatie van het antwoord speelt geen rol.
28
Q

Wat geldt voor een effectieve open vraag?

A

Kort en ehelder
Instructie moet duidelijk maken dat de antwoorden kort dienen te zijn

29
Q

Wat zijn de nadelen van gesloten vragen?

A
  1. Test bestaande uit meerkeuzevragen vereist uitvoerig vooronderzoek
  2. Kans dat respondenten door louter te raden goede antwoorden geven
  3. Slechts eenvoudige cognitieve vaardigheden worden gemeten
30
Q

De vraag of de 2 vraagvormen inderdaad verschillende zaken meten is een empirische kwestie. Wat zegt onderzoek?

A

Dat in vele gevallen het mogelijk is met meerkeuzevragen hetzelfde te meten als met open vragen, mits de meerkeuzevragen goed geconstrueerd zijn.

31
Q

Van welke antwoordvorm wordt vaak gebruik gemaakt voor prestatieniveautests?

A

Meerkeuze

32
Q

Wat is de ‘stam’, ‘keyed response’, en ‘afleiders’ bij items voor prestatieniveaus?

A

Stam: eerste deel van eht item bestaat uit een uitspraak die moet worden aangevuld
Keyed response: goede antwoord
Afleiders: foute antwoorden

33
Q

Items voor prestatieniveau zijn te onderscheiden naar welke 3 principes?

A
  1. Kiezen:
    - eenvoudigste vorm: tweekeuzevorm
    - (in)correcte-antwoordvorm
    - meest/minst juiste-antwoordvorm
    - verschilende-antwoordvorm
    - complexe vormen
  2. Rangschikken
  3. Toeschrijven
34
Q

Wat is het voordeel van de respondent keuzemogelijkheden laten rangschikken?

A

Veel informatie wordt verkregen

35
Q

Hoe staat de methode toeschrijven ook wel bekend?

A

Als matching: uit 2 rijen moet telkens de juiste combi worden gemaakt.

36
Q

Wat is het voordeel en nadeel van de rangschik methode?

A

V: veel info wordt verzameld

N: keuzes zijn niet onafhankelijk van elkaar gescheiden

37
Q

Wat voor items worden vaak gebruikt in tests voor gedragswijze (persoonlijheidsvragenlijsten en attitudetests)?

A

Uitspraken waarbij de respondent kan aangeven in welke mate hij het met de uitspraak eens is.

38
Q

De presentatievorm van items voor gedragswijze tests kan sterk variëren. Wat zijn de belangrijkste aanwijzingen en overwegingen hierbij?

A
  1. Presentatievorm en instructie moeten zodanig zijn dat de respondent niet in de verleiding komt om een kruisje tussen 2 keuzemogelijkheden te zetten.
  2. Het meest bekend zijn de items met 5 mogelijkheden: Likert-items. Belangrijkste keuze is tussen even of oneven aantal. Voordeel van een even aantal is dat de respondent gedwongen wordt een kleur te bekennen.
  3. Mensen zijn doorgaans niet in staat om meer dan 7 nuanceringen te onderscheiden
  4. Voor de verbale aanduiding van de opties zijn geen eensluitende adviezen te geven.
39
Q

Zijn reacties van respondenten in eerste instantie kwantitatief of kwalitatief van aard?

A

Kwalitatief

40
Q

De rijkdom van kwalitatieve informatie ontneemt ons het zicht op…

A

wat we eigenlijk willen meten.

41
Q

Waarom is het belangrijk dat bij testinformatie de reacties zo veel mogelijk gekwantificeerd dienen te worden?

A

Omdat daarmee een heel arsnenaal aan statistische technieken ter beschikking komt, waarmee systematiek en samenhang in getallen en gedrag aan het licht kunnen worden gebracht.

42
Q

Kwantificering van kwalitatieve reacties gaat uit van welke veronderstelling?

A

Dat de antwoordcategorieën van een item geordend kunnen worden op een continuum dat staat voor de psychologische eigenschap die met de test kan worden gemeten.

43
Q

Hoe wordt een item met 2 antwoordcategoreiën genoemd?

A

dichotoom

44
Q

Hoe worden de aan de antwoordcategorieën toegekende getallen genoemd?

A

Scroes

45
Q

Een testconstructie-onderzoek kent ruwweg 2 fasen waarin empirisch onderzoek wordt gedaan naar de kwaliteit van items. Welke 2?

A
  1. Vooronderzoek waarbij in een kleine steekproef (20-100 mensen) de reacties van proefpersonen op de eerste versie van de items worden geanalyseerd. Steekproef hoeft niet altijd respresentatief te zijn.
    Dit dient als een grove zeef om de items te identificeren die niet goed functioneren.
  2. Hoofdonderzoek: grote, representatieve steekproef (500-2000 mensen). Moet een grote steekproef zijn, omdat de populatie vaak in diverse deelgroepen valt op te splitsen, waarvoor aparte normen dienen worden opgesteld. Alle deelgroepen behoren groot genoeg te zijn om normverdelingen van testscores voldoende nauwkeurig te kunnen schatten. Dit is een gestratificeerde steekproef.
46
Q

Hoe noemt men de deelgroepen?

A

Strata

47
Q

Hoe worden de testprestaties voor de gehele steekproef en voor relevante deelgroepen weergegeven?

A

In frequentieverdelingen, waarmee de prestaties van individuen vergeleken kunnen worden (normen).

48
Q

Wat zijn relatieve frequenties?

A

Frequenteis gedeeld door de steekproefgrootte.

49
Q

Hoe wordt de relatieve frequentie op het goede antwoord genoemd bij dichotome items?

En die op de afleiders?

A

p-waarde

A-waarden

50
Q

Wanneer heeft een item uit een studietoets goed gefunctioneerd bij dichotome items?

A

Als de meeste respondenten het goede alternatief hebben gekozen en de afleiders elk ongeveer even vaak werden gekozen.

51
Q

Hoe kan de beoordeling van de kwaliteit van polytome items verlopen?

Wanneer heeft een item goed gefunctioneerd?

A

Uitgaande van items met 5 antwoordcategorieën met de scores 0, 1 2, 3, 4 , is de relatieve frequentieverdeling van de scores vast te stellen. Een item functioneert goed als een goede spreiding van respondenten over de categorieën plaatsvindt.

52
Q

Beoordeel de juistheid van de volgende twee stellingen.

I Uit het observeerbare gedrag van een persoon wordt het niveau van die persoon afgeleid op een niet-observeerbare psychologische eigenschap.
II Items vragen de respondent activiteiten te verrichten op basis waarvan een psychologische eigenschap wordt beoordeeld.

A

I en II zijn juist

53
Q

Wat concludeerde Mellenbergh (1971) ten aanzien van open en gesloten vragen?

A

In vele gevallen is het mogelijk met meerkeuzevragen hetzelfde te meten als met open vragen.

54
Q

De item-restcorrelatie is de correlatie tussen scores op een item en de scores op de rest van de test. Waardoor kan deze waarde worden beïnvloed?

door de mate waarin toets en item hetzelfde meten

door de split-half-betrouwbaarheid van de toets

door de validiteit van het item

door de validiteit van de testscore

A

door de mate waarin toets en item hetzelfde meten

55
Q

Wat is het verschil tussen vaardigheden en capaciteiten?

A

Bij ▌capaciteiten denkt men doorgaans aan relatief stabiele mentale vermogens met een duidelijk erfelijke component. Aan ▌vaardigheden ligt ook een
erfelijke component ten grondslag, maar ze zijn voor een belangrijk deel te leren.

56
Q

Omdat bij open vragen altijd de subjectiviteit van de beoordeling een rol speelt, moet in de
fase van de testconstructie de categorisering van de reacties ….

A

door ten minste twee, onafhankelijke beoordelaars geschieden

57
Q

Overigens moeten de mogelijkheden tot het meten van de hogere mentale functies via open vragen niet worden overschat. Waarom niet? 2x

A

Ten eerste is er het genoemde probleem
van de onbetrouwbaarheid van de beoordeling.

Ten tweede komt het concluderen uit de open
vragen tot hogere mentale functies in feite vaak neer op subjectief fantaseren

58
Q

Een dringend advies is dat alle items uit dezelfde test dezelfde scores krijgen toegekend. Op
deze wijze wordt voorkomen dat bij statistische analyses items verschillend worden gewogen.
Indien toch wordt besloten items verschillend te wegen, moet dit gerechtvaardigd worden
door ….

A

een psychologische theorie over de gemeten eigenschap. Die theorie zou dan het relatieve belang van diverse relevante gedragingen moeten aangeven, en daarmee het relatieve
belang van de items die deze gedragingen oproepen. Wat men wel eens ziet is dat gewichten
voor items via statistische analyses uit de gegevens worden afgeleid, maar het is beter te kiezen voor een meer theoretische fundering en daarop gebaseerde operationalisering.

59
Q

Is een frequentieverdeling definitieve bewijs dat het item goed functioneert?

A

Nee, wel informatief