Hoorcollege 2B: spreidingsmaten, verdelingen en spss bewerkingen Flashcards

(4 cards)

1
Q
  1. Wat is de betekenis van spreiding?

2. Welke soorten spreidingsmaten heb je?

A
  1. De afstand van verschillende onderzoekseenheden ten opzicht van een centraal punt en ten opzicht van elkaar. Staan de onderzoekseenheden dichtbij of ver weg van elkaar? En vanaf het middenpunt want daar staan de meeste mensen. Dichtbij elkaar? > kleine spreiding. Ver weg? > grote spreiding.
  2. Spreidingsmaten:
    - Range: maximum (hoogste waarde) min minimum (laagste waarde), dus het verschil tussen maximum en minimum.
    - Interkwartielafstand: verschil tussen 1e (25%) kwartiel en 3e kwartiel (75%). > (Q3-Q1). Mediaan: 50%. In een boxplot kun je minimum, maximum en verschillende kwartielen zien (boxplot geeft spreiding aan).
    - Variatie: alleen nodig om variantie uit te rekenen. De totale afwijking van het gemiddelde.
    - Variantie: nodig om standaarddeviatie uit te rekenen: gemiddelde van de variatie.
    - Standaarddeviatie: de wortel uit variantie.
    > Alle drie geven de mate aan waarin de onderzoekseenheden afwijken van het gemiddelde (minimale meetniveau interval).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Leg uitgebreid de volgende spreidingsmaten uit:

Variatie - variantie - standaarddeviatie.

A
  1. Variatie= de som van de individuele verschillen t.o.v het gemiddelde in het kwadraat. Spreiding zegt iets over de afstand van een onderzoekseenheid (xi: waarde van elke onderzoekseenheid) t.o.v het gemiddelde (xbar). Als je alle getallen van (xi-xbar) optelt, kom je altijd uit op 0. Dus ga je het kwadrateren om de minnetjes op te heven. En dan tel je het weer bij elkaar op. Dan kun je nog steeds niks zeggen bij totaalgetal > dus variantie uitrekenen.
  2. Variantie (s2)= het gemiddelde van de som van de individuele verschillen t.o.v het gemiddelde in het kwadraat. Gemiddelde maak je door te delen door n (n-1) (n=onderzoeksheden). De variantie is de variatie gedeeld door n-1.
  3. Standaarddeviatie= de wortel van het gemiddelde van de som van de individuele verschillen t.o.v het gemiddelde in het kwadraat. De variantie is moeilijk te interpreteren is door de kwadratensom, neem je de wortel van de variantie: SD.
    Hoe lager de SD, hoe dichterbij de individuele scores van de onderzoekseenheden bij het gemiddelde liggen. SD is de gemiddelde afwijking t.o.v het gemiddelde. Bv. (De spreiding is groter, wanneer SD groter is: er zijn mensen die heel hoog of laag scoren dan het gemiddelde). SD geeft aan hoeveel mensen ongeveer dezelfde scores hebben en hoeveel niet.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q
  1. Welke twee eigenschappen heeft een normale verdeling?
  2. Wat is de empirische regel?
  3. Wat gebeurd er als een verdeling niet normaal, maar scheef (skewness) verdeeld is?
  4. Wat is kurtosis?
  5. Hoeveel SD is een outlier boven of onder het gemiddelde? En voor extreme waarden?
A
  1. Klokvormig (dus symmetrisch: 50% scoort hoger, 50% scoort lager) & unimodaal (modus, mediaan en gemiddelde vallen op 1 punt).
  2. Als de data normaal verdeeld is, oftewel een klokvorm heeft. Opdelen in kleine stukken en percentages geven, die percentages zijn bijv. 2,5%, 13,5%, 34% etc.
  3. Dan kun je geen kansen meer berekenen. Dan heb je teveel outliers of extreme waarden. De skewness heeft een marge van 1. 0,08 is dus prima.
  4. hoge kurtosis wijst op een verdeling met een sterke piek, lage kurtosis wijst op een platte verdeling. Hoe spitster/sterker de verdeling, hoe minder spreiding er is, en hoe minder extreme waarden zich in de verdeling bevinden.
  5. Outlier= bolletjes in boxplot: minstens 3 SD. En extreme waarden zijn minstens 5 SD vanaf gemidelde. (z-score van 5).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q
  1. Wanneer ga je standaardiseren?
  2. Wat zijn z-scores?
  3. Wat voor verdeling is het als er z-scores onder de verdeling worden toegepast?
A
  1. Om appels met peren te vergelijken. Alle twee (IQ en inkomen)hebben een normale verdeling (klokvormig), met verschillende soorten data en meeteenheden. Dus die wil je gaan vergelijken met elkaar. (is er een verband?).
  2. Z-scores zijn gebaseerd op de SD van een variabele (minimaal interval). Z-scores= zijn gestandaardiseerde scores voor een variabele waarbij de variabele wordt ontdaan van zijn meeteenheid. Z-score: het aantal standaarddeviaties dat een bepaalde score boven of onder het gemiddelde van de reeks scores ligt. Z-score= 1, betekent dat de waarde 1 standaarddeviatie groter (of kleiner) is dan het gemiddelde.
  3. Een standaardnormale verdeling: Om verschillende data (IQ en inkomen) in dezelfde verdeling te gebruiken, standaardiseren we deze in met z-score, waardoor je van een normale naar een standaardnormale verdeling (het midden is 0) wordt. De SD van alle -scores is altijd 1.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly