Hoorcollege 2A Flashcards
Spreidingsmaten en positie van observaties (15 cards)
Wat zijn spreidingsmaten?
Range (spreiding)
Interkwartielrange
Gemiddeld absolute afwijking
Variantie/standaarddeviatie
Wat bedoelen we met range?
De afstand tussen de minimum- en maximumscore.
Range = maximum - minimum
Wat bedoelen we met interkwartielrange?
Afstand tussen de eerste en laatste kwart van de scores
Range van de middelste 50% van de scores
Gebruikt kwartielen Q1 en Q3
Wat is Q1?
Mediaan van de eerste helft van de scores
(Alle scores kleiner dan de mediaan)
Wat is Q3?
Mediaan van tweede helft van de scores
(alle scores groter dan de mediaan)
Wat zijn de eigenschappen van de standaarddeviatie (s)?
- S > 0
- S = 0 dan zijn alle scores hetzelfde (Yi hetzelfde voor alle i).
- Hoe meer variabiliteit in de scores, hoe hoger de s.
- Als de verdeling belvormig is -> maak je gebruik van de empirische regel.
- Vooral bruikbaar bij een normaalverdeling.
Wat is de five number summary?
- Minimum
- Eerste kwartiel (Q1)
- Mediaan
- Derde kwartiel (Q3)
- Maximum
- Te visualiseren in een boxplot
Hoe maak je een boxplot?
- Je hebt nodig: 5 number summary, de IQR en 1.5xIQR
- Teken box Q1 Q2 en Q3
- Teken ‘‘snorharen’’ tot min en max die binnen Q1-1.5xIQR en Q3+1.5xIQR vallen.
- Teken de potentiële outliers.
Wat zijn de voordelen en nadelen van een histogram?
- Voordeel: weergave van alle geobserveerde scores.
- Nadeel: histogram meestal niet zo’n efficiënte samenvatting.
- Nadeel: vorm verandert als je andere klassenindeling kiest.
Wat zijn de kenmerken van een dichtheidscurve?
- Altijd boven de x-as
- Totale oppervlakte onder curve op 1 gesteld = 100%
- Dichtheidscurve geeft geen frequenties.
Boxplot versus curve
- Geven beide samenvatting van de hele verdeling.
- Boxplot kan altijd.
- Curve niet informatief als hij slecht past.
- Curve onbetrouwbaar bij weinig data.
- Curve kan goede representatie zijn voor populatieverdeling.
- Bekendste curve: de standaardnormaalverdeling
Wat kun je vertellen over percentielen?
- Q1 (25%) Q2 (mediaan 50%) en Q3 (75%)
- Kan voor ieder percentage.
- Percentiel, p, het punt waarbij p% van de observaties op of onder dit punt vallen, en 100-p% van de observaties erboven.
- Uit frequentietabel te halen.
- Cumulatieve percentages.
Wat kun je vertellen over potentiële uitbijters (outlier)?
- Uitbijter: extreme observatie
- IQR: interkwartielafstand: Q3-Q1
- Richtlijn: uitbijter als Q1-1.5xIQR of Q3+1.5xIQR
- Te visualiseren in boxplot
Wat kun je vertellen over z-scores?
- Gestandaardiseerde score op een variabele.
- Hoeveel standaarddeviatie van het gemiddelde iemand af zit.
- Zi is de gestandaardiseerde versie van score Yi.
- Vooral handig bij normaal verdeelde variabelen -> empirische regel toepassen.
Interpretatie van z-scores
- Z-score geeft aan hoeveel standaarddeviatie de score Yi boven gemiddelde y met streepje ligt.
- Stel Z=2 dan ligt … 2sd boven gemiddelde.
- stel Z= -1,2 dan ligt …. 1,2sd onder gemiddelde.