T2 Item-analyse & T2.1 Verdelingvormen Flashcards

(95 cards)

1
Q

Wat zijn item-analyses?

A

analyses waarmee wordt geverifieerd of de toepassing van een meetinstrument in een steekproef goed is verlopen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat betekent het als je een item-analyse doet als onderdeel van een data-screening?

A

er wordt gekeken of de datareeksen die zijn verzameld met elk item wel kloppen met het responsmodel dat bij dat item hoort, zoals vastgesteld tijdens de ontwikkeling van het meetinstrument.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat is een datareeks?

A

Een reeks van datapunten die hetzelfde representeren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welke meetniveaus zijn er? Orden van laag naar hoog.

A
  1. Nominaal: categorieën die niet te ordenen zijn, en je kan er ook niet mee rekenen.
    »> Dichotome/binaire variabele: nominale variabele die maar 2 waarden kan aannemen
  2. Ordinaal: categorieën die te ordenen zijn, maar de afstand tussen de geordende categorieën is onbekend

3.Continu: Tegenover categorische variabelen staan continue variabelen. Deze variabelen kunnen in theorie alle denkbare meetwaarden aannemen, meestal op een schaal van ‘min oneindig’ tot ‘plus oneindig’, waarbij waarden steeds onwaarschijnlijker worden naarmate ze verder van het gemiddelde af liggen. Dit geldt niet voor alle variabelen: lengte kan bijvoorbeeld niet negatief zijn.
Kan mee gerekend worden.
»interval
»> ratio:

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hoe heten nominale en ordinale variabelen samengenomen?

A

Categorische of discrete variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Binnen de continue variabelen worden soms twee meetniveaus onderscheiden: het interval niveau en het ratio niveau. Wat is het verschil?

A

Het verschil tussen deze twee meetniveaus is het al dan niet bestaan van een zogenaamd ‘absoluut nulpunt’, waardoor er wel of niet een verhouding tussen twee getallen uitgedrukt kan worden. Lengte is bijvoorbeeld een variabele op rationiveau.
Interval: 0 heeft een waarde
Ratio: 0 heeft geen waarde

Voor de toepassing van statistiek is het onderscheid tussen het interval- en het rationiveau niet belangrijk. Het is enkel belangrijk dat ze beide continu zijn, want met continue variabelen kan gerekend worden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hebben variabelen een vast meetniveau?

A

Variabelen hebben niet altijd een vast meetniveau, het meetniveau van een variabele is een keuze die de onderzoeker maakt tijdens het operationaliseren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Kiezen voor een categorisch meetniveau terwijl een variabele op een continu niveau gemeten kan worden, kan schadelijk zijn voor het onderzoek om vier redenen. Welke vier?

A

Er zijn altijd meer deelnemers nodig naarmate het meetniveau van de betreffende variabelen lager is. Een verband aantonen tussen twee continue variabelen vereist minder deelnemers dan wanneer een van de variabelen categorisch is, laat staan als beide variabelen categorisch zijn.

Veel variabelen die we willen meten in onderzoek zijn continu. Daar waar mensen categorieën waarnemen, blijkt na nader onderzoek meestal dat er in feite sprake is van een of meer onderliggende continue variabelen, die mensen min of meer arbitrair in groepen indelen. Categorische operationalisaties zijn dus niet altijd valide.

Het is altijd mogelijk om van een continue variabele terug te gaan naar lagere niveaus, maar niet andersom. Als een deelnemer ‘35 tot 50’ aankruist, is onbekend of de leeftijd
36
is of
47
.

Groepen mensen bestaan vaak niet uit duidelijk onderscheidbare subgroepen. Elke indeling in categorieën geeft dus vaak een vertekening van de werkelijkheid. Het meten van variabelen op een categorisch meetniveau vereist namelijk dat harde grenswaarden, zogenaamde ‘cut-offs’, worden gekozen. Om het leeftijdsvoorbeeld weer te gebruiken: je neemt hierbij aan dat iemand van
36
veel meer lijkt op iemand van
49
dan op iemand van
34
. Als dit niet zo is, is een cut-off van
35
niet goed te verdedigen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Er zijn best wat situaties waarbij we onderzoek doen met categorische variabelen. Welke?

A

Ten eerste resulteren manipulaties in experimenteel onderzoek bijna altijd in categorische variabelen.

Ten tweede moet bij de ontwikkeling van meetinstrumenten niet alleen gelet worden op het optimale meetniveau. Een operationalisatie moet bovenal valide en betrouwbaar zijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat is een datapunt?

A

Een datapunt is een representatie van de uitkomst van een meting.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat is een datareeks?

A

Een reeks van meerdere datapunten die hetzelfde representeren heet een datareeks

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Welke meetniveaus zijn er?

A
  1. Continu (hoogste meetniveau; van min oneindig naar plus oneindig)
    1.1. Interval niveau (absoluut 0 punt besetaat, zoals bij temperatuur)
    1.2. Ratio niveau
  2. Nominaal (laagste meetniveau; categorieën die niet te ordenen zijn)
    e.g. geslacht is een dichotome/binaire variabele = nominale variabele die 2 waarden kan aannemen.
  3. Ordinaal (categorieën die te ordenen zijn; afstand tussen categorieën is onbekend)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hoe heten nominale en ordinale variabelen samen?

A

Categorische of discrete variabelen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hebben variabelen altijd een vast meetniveau?

A

Nee, meetniveau wordt bepaald door de onderzoeker tijdens het operationaliseren. Meetniveaus zijn dus kenmerken van operationalisaties.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Kiezen voor een categorisch meetniveau terwijl een variabele op een continu niveau gemeten kan worden, kan schadelijk zijn voor het onderzoek om vier redenen. Welke 4?

A
  1. Er zijn altijd meer deelnemers nodig naarmate het meetniveau van de betreffende variabelen lager is
  2. Veel variabelen die we willen meten in onderzoek zijn continu; categorische operationalisaties zijn dus niet altijd valide.
  3. Het is altijd mogelijk om van een continue variabele terug te gaan naar lagere niveaus, maar niet andersom.
  4. Groepen mensen bestaan vaak niet uit duidelijk onderscheidbare subgroepen. Elke indeling in categorieën geeft dus vaak een vertekening van de werkelijkheid.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wat is een dataset?

A

Een dataset is een verzameling datareeksen die zo zijn georganiseerd dat duidelijk is welke data bij elkaar horen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Wat zijn aandachtspunten bij een variabelenaam kiezen?

A
  1. Spreken voor zichzelf: vermijd dus cryptische termen en afkortingen.
  2. Engelstalig
  3. Geen problematische karakters: geen spaties en speciale tekens
  4. Machine readability
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Datareeksen hebben altijd een verdeling. In de statistiek zijn allerlei verdelingsvormen bekend die gebruikt kunnen worden om data efficiënt te beschrijven.

Wat zijn 6 voorbeelden van verdelingsvormen?

A
  1. Linksscheve verdeling (piek zit rechts)
  2. Normaalverdeling
  3. Rechtsscheve verdeling (piek zit links)
  4. Uniforme verdeling
  5. Een tweetoppige verdeling
  6. Een F(3,100)-verdeling.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Wat betekent verdelingsvorm?

A

De manier waarop de datapunten om het gemiddelde heen liggen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Wat zijn verdelingsmaten?

A

Kwantitatieve indicatoren voor de verdelingsvorm.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Over het algemeen zijn er drie termen die gebruikt worden om een verdelingsvorm te beschrijven. Welke 3?

A
  1. de modaliteit (‘toppigheid’)
  2. de scheefheid (‘skewness’)
  3. de spitsheid (‘kurtosis’) van een verdeling.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Met welke verdelingsmaten kunnen de aanwezigheid van de modaliteit, scheefheid en spitsheid getoetst worden?

A
  1. de Hartigans’ dip test (unimodaliteit)
  2. skewness (scheefheid)
  3. kurtosis (spitsheid).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Wat is unimodaal vs multimodaal?

A

eentoppig vs meertoppig

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

In de praktijk zijn multimodale verdelingen vaak een indicatie dat …..

A

de populatie uit meerdere subpopulaties bestaat.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Het uiteindelijke doel is om op basis van de verdelingsvorm in een streekproef iets te kunnen zeggen over de...
verdelingsvorm van de populatie.
26
Welke verdelingsmaat hoort bij modaliteit?
de Hartigan’s diptest. Deze test geeft een indicatie van de unimodaliteit van een verdeling. Een perfect unimodale verdeling heeft een diptestwaarde van 0 . Naarmate een verdeling ‘meertoppiger’ lijkt te zijn – dus minder duidelijk eentoppig – wordt deze waarde steeds groter. Er zijn geen concrete vuistregels wanneer de waarde groot genoeg is om te spreken van bimodaliteit.
27
Wat is scheefheid (skewness) en wat beschrijft het?
Scheefheid beschrijft of een verdeling symmetrisch of asymmetrisch is. Het geeft aan of de meeste datapunten aan één kant van de schaal liggen.
28
Welke soorten scheve verdelingen bestaan er?
Er zijn drie soorten scheve verdelingen: 1. symmetrische (eentoppige), 2. linksscheve (negatief scheve) 3. rechtsscheve (positief scheve) verdelingen.
29
Hoe ziet een symmetrische verdeling eruit en waar liggen de meeste datapunten?
Bij een symmetrische verdeling liggen de meeste datapunten rondom het gemiddelde. Het heeft de vorm van een klok, ook wel 'bell curve' genoemd.
30
Hoe wordt een linksscheve verdeling gekenmerkt?
Een linksscheve verdeling heeft minder datapunten aan de linkerkant van het gemiddelde. Er is een staart met datapunten relatief ver weg van het gemiddelde aan de linkerkant.
31
Wat is kenmerkend voor een rechtsscheve verdeling?
Bij een rechtsscheve verdeling liggen juist de meeste datapunten links van het gemiddelde. Rechts van het gemiddelde liggen minder datapunten in een staart.
32
Geef voorbeelden van toepassingen van scheve verdelingen.
Scheve verdelingen komen voor bij indicatoren zoals 'gepest worden', 'depressie', en 'burn-out', waar de meeste datapunten aan de lage scores van de variabele liggen.
33
Wat is de verdelingsmaat voor scheefheid en hoe wordt het beïnvloed door de vorm van de verdeling?
De verdelingsmaat voor scheefheid heet skewness. Bij een perfect symmetrische verdeling is de skewness bijna 0. Meer linksscheve verdelingen hebben een kleinere (negatievere) skewness, terwijl meer rechtsscheve verdelingen een grotere (positievere) skewness hebben.
34
Welke vuistregels worden gebruikt om afwijking van normaliteit te bepalen op basis van skewness?
Een conservatieve vuistregel stelt een skewness van -1 tot 1 voor, terwijl liberale vuistregels spreken van schending bij een skewness van -3 tot 3.
35
Wat is spitsheid (kurtosis) en waar beschrijft het?
Spitsheid beschrijft hoe spits of plat een verdeling is. Het geeft aan hoeveel de datapunten rond de centrale waarde zijn geconcentreerd.
36
Dat is het extreemste voorbeeld van een verdeling op het gebied van spitsheid?
Het extreemste voorbeeld is een verdeling waarbij alle datapunten dezelfde waarde hebben. Dit is de spitsste mogelijke verdeling.
37
Hoe wordt een verdeling genoemd die erg spits is?
Een verdeling die erg spits is, wordt een leptokurte verdeling genoemd, waarbij 'lepto-' staat voor 'spits'.
38
Hoe wordt een verdeling genoemd die erg plat is?
Een verdeling die erg plat is, wordt een platykurte verdeling genoemd, waarbij 'platy-' staat voor 'plat'.
39
Geef een voorbeeld van een spits-verdeelde variabele en leg uit waarom deze spits is.
Een voorbeeld is de leeftijd van kinderen in dezelfde groep op school. Hun leeftijden lijken erg op elkaar, waardoor alle datapunten dicht bij elkaar liggen.
40
Wat is de verdelingsmaat voor spitsheid en hoe wordt het beïnvloed door de vorm van de verdeling?
De verdelingsmaat voor spitsheid heet kurtosis. Bij een perfect normale verdeling is de kurtosis 0. Meer platte verdelingen hebben een kleinere (negatievere) kurtosis, terwijl meer spitse verdelingen een grotere (positievere) kurtosis hebben.
41
Welke vuistregels worden gebruikt om afwijking van normaliteit te bepalen op basis van kurtosis?
Een conservatieve vuistregel stelt een kurtosis van -1 tot 1 voor, terwijl liberale vuistregels spreken van schending bij een kurtosis van -3 tot 3
42
Hoe wordt een verdeling genoemd waarbij alle waarden even vaak voorkomen?
Een verdeling waarbij alle waarden even vaak voorkomen, wordt een uniforme verdeling genoemd.
43
Wat wordt bedoeld met een normale verdeling?
Een normale verdeling is een unimodale, symmetrische verdeling die niet bijzonder plat of spits is. Het is de maatstaf voor verdelingsmaten zoals diptest, skewness en kurtosis.
44
Welke kenmerken heeft een normaalverdeling?
1. Unimodaal. 2. Niet scheef (perfect symmetrisch). 3. Niet bijzonder spits of plat.
45
Hoeveel procent van de datapunten ligt binnen één standaarddeviatie van het gemiddelde in een normale verdeling?
Ongeveer 68% van de datapunten.
46
Hoeveel procent van de datapunten ligt binnen twee standaarddeviaties van het gemiddelde in een normale verdeling?
Ongeveer 95% van de datapunten.
47
Hoeveel procent van de datapunten ligt binnen drie standaarddeviaties van het gemiddelde in een normale verdeling?
Ongeveer 99,7% van de datapunten, dus bijna allemaal
48
Waarom is de normale verdeling belangrijk in de wetenschap?
Veel variabelen in de natuur zijn normaal verdeeld, en ruis zoals meetfouten volgt ook een normale verdeling. Het is een basis voor statistische analyses in disciplines zoals psychologie en onderwijswetenschappen.
49
Wie ontwikkelde de formule voor de normaalverdeling en wanneer?
De formule voor de normaalverdeling werd ontwikkeld door Gauss in 1809. Hij toonde aan dat ruis, zoals meetfouten, volgens deze verdeling waren verdeeld.
50
Hoe wordt een verdeling genoemd die erg in de buurt komt van een perfecte normale verdeling?
Een verdeling die erg in de buurt komt van een perfecte normale verdeling mag nog steeds als een normale verdeling worden beschouwd, zelfs als de waarden iets afwijken van nul.
51
Wat is een standaardnormale verdeling en wat zijn z-scores?
Een standaardnormale verdeling heeft een gemiddelde van 0 en een standaarddeviatie van 1. Z-scores zijn de afstanden van elk datapunt tot het gemiddelde in deze verdeling.
52
Hoe wordt een proces genoemd waarbij datapunten worden omgerekend naar z-scores?
Dit proces heet standaardisering.
53
Hoe bereken je een z-score voor een datapunt?
De z-score wordt berekend door het datapunt af te trekken van het gemiddelde en te delen door de standaarddeviatie.
54
Wat betekent een z-score van 2?
Een z-score van 2 betekent dat het datapunt 2 standaarddeviaties boven het gemiddelde ligt.
55
Hoeveel procent van de datapunten ligt binnen 2 standaarddeviaties van het gemiddelde in een standaardnormale verdeling?
Ongeveer 95% van de datapunten.
56
Wat betekent een z-score van -1.28 in een standaardnormale verdeling?
Een z-score van -1.28 betekent dat het datapunt 1.28 standaarddeviaties onder het gemiddelde ligt.
57
Verandert standaardisering de onderliggende verdeling van de waarden?
Nee, standaardisering verandert de onderliggende verdeling van de waarden niet.
58
Waarom zijn z-scores handig in statistische analyses?
Z-scores maken vergelijkingen tussen variabelen op verschillende schalen mogelijk en geven informatie over de afstand van een waarde tot het gemiddelde in standaarddeviaties.
59
Wat is de populatieverdeling en waarom is deze belangrijk?
De populatieverdeling is de verdeling van een variabele in de hele populatie. Het is belangrijk omdat het ons inzicht geeft in kenmerken van de gehele populatie.
60
Hoe kunnen we de populatieverdeling benaderen als we deze niet volledig kunnen kennen?
We maken gebruik van steekproeven en bekijken de verdeling van steekproefscores. Hoe groter de steekproef, hoe meer deze verdeling lijkt op de populatieverdeling.
61
Waarom is het bepalen van de vorm van de populatieverdeling een subjectief proces?
Het is subjectief omdat het afhangt van interpretatie. Bij ambiguïteit in de steekproefverdeling is het moeilijk om conclusies te trekken over de populatieverdeling.
62
Welke uitdagingen kunnen optreden bij het trekken van conclusies over de populatieverdeling?
Uitdagingen zijn onder andere het identificeren van outliers, interpreteren van bimodale verdelingen en bepalen of ruis meetfout of echte variatie is.
63
Wat is belangrijk bij het trekken van conclusies op basis van statistische informatie?
Het is belangrijk om kritisch te zijn, niet alleen naar grafieken en verdelingsmaten te kijken, maar ook andere informatiebronnen te raadplegen, zoals eerdere onderzoeken en de context van het onderzoek.
64
Wat is de rol van de onderzoeker bij het trekken van conclusies?
Het is de taak van de onderzoeker om de meest logische verklaring te vinden gegeven de data en eerdere onderzoeken. Deze verklaringen moeten steeds worden onderbouwd met een overtuigende redenering.
65
Waarom is transparantie belangrijk in onderzoek?
d: Omdat verschillende onderzoekers het oneens kunnen zijn over conclusies, is het belangrijk om transparant te zijn in de beslissingen en de achterliggende redenering helder weer te geven.
66
Wat is een belangrijke vaardigheid voor onderzoekers bij het trekken van conclusies?
Het vermogen om kritisch te denken en om conclusies te onderbouwen met sterke redeneringen.
67
Wat is een density plot en wat geeft het weer?
Een density plot is een grafische weergave van de dichtheid van een verdeling. Het geeft aan hoeveel datapunten er voor een gegeven meetwaarde zijn en heeft altijd een oppervlakte van 1.
68
Wat zijn de voordelen van een density plot ten opzichte van een histogram?
Een density plot maakt het eenvoudiger om de kans op een bepaalde waarde af te lezen, omdat het de proportie van de datapunten weergeeft. Het is ook handig om afwijkingen van de normale verdeling te kunnen zien.
69
Wat is een Q-Q plot en hoe wordt het gebruikt om verdelingen te vergelijken?
Een Q-Q plot vergelijkt de geobserveerde kwantielen uit de data met de verwachte kwantielen op basis van een normale verdeling. Als de data normaal verdeeld is, liggen alle kwantielen op een diagonale lijn.
70
Wat toont een boxplot en hoe worden de kwartielen weergegeven?
Een boxplot toont de verdeling van de data aan de hand van drie kwartielen. De middelste lijn geeft de mediaan aan, de boxen eromheen geven het 1e en 3e kwartiel aan.
71
Wat is een staafdiagram en hoe verschilt het van een histogram?
Een staafdiagram wordt gebruikt voor categorische variabelen en geeft het aantal datapunten per categorie weer. In tegenstelling tot een histogram heeft het geen continue variabele op de x-as.
72
Wat is een belangrijk aspect bij het beoordelen van de verdeling van een variabele in een steekproef?
et is belangrijk om verschillende informatiebronnen te combineren en kritisch na te denken over de vorm van de verdeling, omdat het een subjectief proces is.
73
Hoe kan het combineren van verschillende grafieken en kwantitatieve indicatoren helpen bij het beoordelen van een verdeling?
Het combineren van bijvoorbeeld histogrammen, Q-Q-plots en boxplots, samen met kwantitatieve indicatoren zoals skewness en kurtosis, kan helpen bij het identificeren van outliers en het beoordelen van de vorm van de verdeling.
74
Waarom is het belangrijk om redeneringen bij beslissingen op basis van data en statistiek te documenteren?
Het documenteren van redeneringen is belangrijk tijdens de studie voor feedback en correcties, en bij wetenschappelijk onderzoek zodat andere wetenschappers de redeneringen kunnen volgen en eventuele fouten kunnen detecteren.
75
Wat wordt bedoeld met het responsmodel bij de ontwikkeling van meetinstrumenten?
Het responsmodel beschrijft hoe het doelconstruct de geregistreerde responsen van het meetinstrument veroorzaakt, vaak gebaseerd op fundamenteel onderzoek in de psychologie.
76
Waarom is het belangrijk om een goed responsmodel te ontwikkelen bij het maken van meetinstrumenten?
Het is belangrijk omdat het vertrouwen in de validiteit van het meetinstrument afhankelijk is van het begrip van hoe het werkt en hoe het doelconstruct een rol speelt bij het genereren van de geregistreerde responsen.
77
Hoe kunnen causale ketens worden getest bij de ontwikkeling van een meetinstrument?
Idealiter worden causale ketens getest door experimenteel onderzoek, waarbij verschillende onderdelen van de keten worden gemanipuleerd om de relatie tussen het doelconstruct en de geregistreerde responsen te begrijpen.
78
Wat zijn mogelijke uitdagingen bij het opstellen van een responsmodel?
Uitdagingen kunnen ontstaan wanneer er nog maar weinig onderzoek beschikbaar is, wat extra werk en mogelijk meerdere studies vereist. Soms moet men werken met minder sterk geverifieerde responsmodellen gebaseerd op observationeel onderzoek.
79
Wat wordt bedoeld met de verwachte verdeling per item bij de ontwikkeling van meetinstrumenten?
De verwachte verdeling per item beschrijft hoe de responsen op elk item naar verwachting verdeeld zouden moeten zijn, gebaseerd op het responsmodel en theoretische aannames.
80
Welke mogelijke verwachtingspatronen kunnen worden toegepast bij het inschatten van de verdeling per item?
Voorbeelden zijn de uniforme verdeling (elke antwoordoptie wordt even vaak gekozen), de normaalverdeling (meeste mensen kiezen het middelste antwoord), en de rechtsscheve verdeling (meeste mensen kiezen voor lage waarden).
81
Hoe kunnen de gevonden verdelingen per item worden vergeleken met de verwachte verdelingen?
Tijdens de validatie van een meetinstrument worden de gevonden verdelingen voor elk item vergeleken met de verwachte verdelingen op basis van de theorie en het onderzoek naar het responsmodel in de gegeven populatie en context.
82
Wat betekenen afwijkingen tussen de gevonden en verwachte verdelingen voor een item?
Afwijkingen tussen de gevonden en verwachte verdelingen kunnen duiden op een onjuist responsmodel voor de specifieke context of populatie, wat het vertrouwen in de validiteit van het meetinstrument aantast.
83
Wat is de relatie tussen Pearson's r en de normaliteit van de verdeling van variabelen?
Pearson's r meet de lineaire samenhang tussen twee variabelen. Als beide variabelen normaal verdeeld zijn, kan de correlatie maximaal 1
84
Hoe beïnvloedt de scheefheid van de verdeling van variabelen de maximaal haalbare correlatie?
ij scheve verdelingen daalt de maximaal haalbare correlatie. Dit komt omdat de lineaire relatie tussen variabelen verstoord wordt door niet-normale verdelingen.
85
Is normaliteit vereist voor de Steekproefscores of de populatieverdeling om een betrouwbare correlatie te verkrijgen?
Nee, normaliteit is niet vereist voor de steekproefscores of de populatieverdeling. Zelfs bij afwijkingen van normaliteit kan Pearson's r een goede indruk geven van de samenhang tussen variabelen.
86
Wat zijn enkele voorbeelden van extreme afwijkingen van normaliteit die de maximaal haalbare correlatie beïnvloeden?
Voorbeelden zijn extreem linksscheve of rechtsscheve verdelingen. Deze kunnen de correlatie verlagen, maar zelfs dan kan Pearson's r nog steeds nuttige informatie verschaffen over de samenhang tussen variabelen.
87
Waarom worden sommige meetinstrumenten ontwikkeld met items die normaal verdeeld zijn?
Sommige meetinstrumenten, zoals die voor IQ-scores, worden ontwikkeld met normaal verdeelde items om een standaardverdeling te creëren waarbij de meeste scores in het midden liggen en extremen zeldzaam zijn.
88
Waarom is variatie in de verdelingsvormen van items belangrijk bij de ontwikkeling van eetinstrumenten met item-responstheorie?
Variatie in de verdelingsvormen van items, zoals linksscheef, rechtsscheef en normaal verdeeld, helpt bij het creëren van een evenwichtige mix van 'makkelijke', 'moeilijke' en middelmatige items, wat cruciaal is voor de validiteit van het meetinstrument.
89
Waarom is het belangrijk om naar de verdelingsvorm van items te kijken bij de toepassing van een meetinstrument?
Het is belangrijk omdat de verdelingsvorm van items kan variëren afhankelijk van het meetinstrument en de doelvariabele. Dit kan van invloed zijn op de interpretatie van de scores en de validiteit van het instrument.
90
Is het noodzakelijk dat itemscores of geaggregeerde scores van een meetinstrument normaal verdeeld zijn?
Nee, het is niet noodzakelijk. De verdelingsvorm van items hangt af van de aard van de variabele en het doel van het meetinstrument. Verschillende verdelingsvormen kunnen passend zijn, afhankelijk van de context en het meetdoel.
91
Waarom kunnen lagere maximale correlaties tussen items in een meetinstrument geen slecht teken zijn?
Lagere maximale correlaties kunnen optreden als gevolg van het opnemen van items met verschillende verdelingsvormen, wat op zichzelf een geldige en nuttige strategie kan zijn bij het ontwikkelen van een meetinstrument.
92
Waarom is het belangrijk om een idee te hebben van de verwachte correlaties tussen items in een meetinstrument?
et is belangrijk omdat het helpt om te begrijpen hoe de items samenhangen en om de validiteit van het meetinstrument te evalueren. Verwachte correlaties bieden een kader voor het interpreteren van de resultaten van het meetinstrument.
93
Wat is de relatie tussen de verdelingsvormen van items en de correlaties tussen die items?
Hoe meer verschillende verdelingsvormen de items hebben, hoe lager de correlaties tussen de items zullen zijn. Dit komt doordat items met verschillende verdelingsvormen verschillende aspecten van het gemeten construct kunnen vastleggen.
94
Waarom is kennis van de verwachte correlaties tussen items belangrijk in de derde studietaak in dit thema?
Het begrijpen van de verwachte correlaties tussen items is essentieel voor de derde studietaak, omdat het helpt bij het interpreteren van de resultaten en het evalueren van de validiteit van het meetinstrument dat in die taak wordt ontwikkeld.
95