T2 Item-analyse & T2.1 Verdelingvormen Flashcards
(95 cards)
Wat zijn item-analyses?
analyses waarmee wordt geverifieerd of de toepassing van een meetinstrument in een steekproef goed is verlopen.
Wat betekent het als je een item-analyse doet als onderdeel van een data-screening?
er wordt gekeken of de datareeksen die zijn verzameld met elk item wel kloppen met het responsmodel dat bij dat item hoort, zoals vastgesteld tijdens de ontwikkeling van het meetinstrument.
Wat is een datareeks?
Een reeks van datapunten die hetzelfde representeren.
Welke meetniveaus zijn er? Orden van laag naar hoog.
- Nominaal: categorieën die niet te ordenen zijn, en je kan er ook niet mee rekenen.
»> Dichotome/binaire variabele: nominale variabele die maar 2 waarden kan aannemen - Ordinaal: categorieën die te ordenen zijn, maar de afstand tussen de geordende categorieën is onbekend
3.Continu: Tegenover categorische variabelen staan continue variabelen. Deze variabelen kunnen in theorie alle denkbare meetwaarden aannemen, meestal op een schaal van ‘min oneindig’ tot ‘plus oneindig’, waarbij waarden steeds onwaarschijnlijker worden naarmate ze verder van het gemiddelde af liggen. Dit geldt niet voor alle variabelen: lengte kan bijvoorbeeld niet negatief zijn.
Kan mee gerekend worden.
»interval
»> ratio:
Hoe heten nominale en ordinale variabelen samengenomen?
Categorische of discrete variabelen
Binnen de continue variabelen worden soms twee meetniveaus onderscheiden: het interval niveau en het ratio niveau. Wat is het verschil?
Het verschil tussen deze twee meetniveaus is het al dan niet bestaan van een zogenaamd ‘absoluut nulpunt’, waardoor er wel of niet een verhouding tussen twee getallen uitgedrukt kan worden. Lengte is bijvoorbeeld een variabele op rationiveau.
Interval: 0 heeft een waarde
Ratio: 0 heeft geen waarde
Voor de toepassing van statistiek is het onderscheid tussen het interval- en het rationiveau niet belangrijk. Het is enkel belangrijk dat ze beide continu zijn, want met continue variabelen kan gerekend worden
Hebben variabelen een vast meetniveau?
Variabelen hebben niet altijd een vast meetniveau, het meetniveau van een variabele is een keuze die de onderzoeker maakt tijdens het operationaliseren
Kiezen voor een categorisch meetniveau terwijl een variabele op een continu niveau gemeten kan worden, kan schadelijk zijn voor het onderzoek om vier redenen. Welke vier?
Er zijn altijd meer deelnemers nodig naarmate het meetniveau van de betreffende variabelen lager is. Een verband aantonen tussen twee continue variabelen vereist minder deelnemers dan wanneer een van de variabelen categorisch is, laat staan als beide variabelen categorisch zijn.
Veel variabelen die we willen meten in onderzoek zijn continu. Daar waar mensen categorieën waarnemen, blijkt na nader onderzoek meestal dat er in feite sprake is van een of meer onderliggende continue variabelen, die mensen min of meer arbitrair in groepen indelen. Categorische operationalisaties zijn dus niet altijd valide.
Het is altijd mogelijk om van een continue variabele terug te gaan naar lagere niveaus, maar niet andersom. Als een deelnemer ‘35 tot 50’ aankruist, is onbekend of de leeftijd
36
is of
47
.
Groepen mensen bestaan vaak niet uit duidelijk onderscheidbare subgroepen. Elke indeling in categorieën geeft dus vaak een vertekening van de werkelijkheid. Het meten van variabelen op een categorisch meetniveau vereist namelijk dat harde grenswaarden, zogenaamde ‘cut-offs’, worden gekozen. Om het leeftijdsvoorbeeld weer te gebruiken: je neemt hierbij aan dat iemand van
36
veel meer lijkt op iemand van
49
dan op iemand van
34
. Als dit niet zo is, is een cut-off van
35
niet goed te verdedigen.
Er zijn best wat situaties waarbij we onderzoek doen met categorische variabelen. Welke?
Ten eerste resulteren manipulaties in experimenteel onderzoek bijna altijd in categorische variabelen.
Ten tweede moet bij de ontwikkeling van meetinstrumenten niet alleen gelet worden op het optimale meetniveau. Een operationalisatie moet bovenal valide en betrouwbaar zijn.
Wat is een datapunt?
Een datapunt is een representatie van de uitkomst van een meting.
Wat is een datareeks?
Een reeks van meerdere datapunten die hetzelfde representeren heet een datareeks
Welke meetniveaus zijn er?
- Continu (hoogste meetniveau; van min oneindig naar plus oneindig)
1.1. Interval niveau (absoluut 0 punt besetaat, zoals bij temperatuur)
1.2. Ratio niveau - Nominaal (laagste meetniveau; categorieën die niet te ordenen zijn)
e.g. geslacht is een dichotome/binaire variabele = nominale variabele die 2 waarden kan aannemen. - Ordinaal (categorieën die te ordenen zijn; afstand tussen categorieën is onbekend)
Hoe heten nominale en ordinale variabelen samen?
Categorische of discrete variabelen.
Hebben variabelen altijd een vast meetniveau?
Nee, meetniveau wordt bepaald door de onderzoeker tijdens het operationaliseren. Meetniveaus zijn dus kenmerken van operationalisaties.
Kiezen voor een categorisch meetniveau terwijl een variabele op een continu niveau gemeten kan worden, kan schadelijk zijn voor het onderzoek om vier redenen. Welke 4?
- Er zijn altijd meer deelnemers nodig naarmate het meetniveau van de betreffende variabelen lager is
- Veel variabelen die we willen meten in onderzoek zijn continu; categorische operationalisaties zijn dus niet altijd valide.
- Het is altijd mogelijk om van een continue variabele terug te gaan naar lagere niveaus, maar niet andersom.
- Groepen mensen bestaan vaak niet uit duidelijk onderscheidbare subgroepen. Elke indeling in categorieën geeft dus vaak een vertekening van de werkelijkheid.
Wat is een dataset?
Een dataset is een verzameling datareeksen die zo zijn georganiseerd dat duidelijk is welke data bij elkaar horen.
Wat zijn aandachtspunten bij een variabelenaam kiezen?
- Spreken voor zichzelf: vermijd dus cryptische termen en afkortingen.
- Engelstalig
- Geen problematische karakters: geen spaties en speciale tekens
- Machine readability
Datareeksen hebben altijd een verdeling. In de statistiek zijn allerlei verdelingsvormen bekend die gebruikt kunnen worden om data efficiënt te beschrijven.
Wat zijn 6 voorbeelden van verdelingsvormen?
- Linksscheve verdeling (piek zit rechts)
- Normaalverdeling
- Rechtsscheve verdeling (piek zit links)
- Uniforme verdeling
- Een tweetoppige verdeling
- Een F(3,100)-verdeling.
Wat betekent verdelingsvorm?
De manier waarop de datapunten om het gemiddelde heen liggen
Wat zijn verdelingsmaten?
Kwantitatieve indicatoren voor de verdelingsvorm.
Over het algemeen zijn er drie termen die gebruikt worden om een verdelingsvorm te beschrijven. Welke 3?
- de modaliteit (‘toppigheid’)
- de scheefheid (‘skewness’)
- de spitsheid (‘kurtosis’) van een verdeling.
Met welke verdelingsmaten kunnen de aanwezigheid van de modaliteit, scheefheid en spitsheid getoetst worden?
- de Hartigans’ dip test (unimodaliteit)
- skewness (scheefheid)
- kurtosis (spitsheid).
Wat is unimodaal vs multimodaal?
eentoppig vs meertoppig
In de praktijk zijn multimodale verdelingen vaak een indicatie dat …..
de populatie uit meerdere subpopulaties bestaat.