College 2a Flashcards

(30 cards)

1
Q

Q1

A

de eerste 25% van de observaties, ook mediaan van eerste helft van de scores

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Q3

A

tot 75% van de observaties, ook mediaan van de tweede helft van de scores

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Spreidingsmaten

A
  • range
  • interkwartielrange (verschil q1 en q3)
  • gemiddeld absolute afwijking
  • variantie/standaarddeviatie
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Range

A

afstand tussen minimum en maximum score

Range = maximum - minimum

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Interkwartielrange (IQR)

A

Afstand tussen q1 en q3, range van middelste 50% van de scores

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

gemiddelde absolute afwijking

A

spreiding als afwijking van het gemiddelde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

absolute waarde

A

grote van het getal, zonder - als die er is

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

waarom gebruiken we gemiddelde absolute afwijking meestal niet, en wat doen we dan wel?

A

de gaa is wiskundig minder bruikbaar. Daarom gebruiken we de standaarddeviatie, of ook wel standaardafwijking genoemd. Deze gebruikt niet de absolute afwijking, maar de gekwadrateerde afwijking.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Eigenschappen standaarddeviatie

A

nooit negatief
bij 0 spreiding zijn alle gegevens hetzelfde
hoe meer variabiliteit in de scores, hoe hoger de standaarddeviatie
Als verdeling belvormig of symmetrisch is, geld de empirische regel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

empirische regel

A

ongeveer 68% van de scores valt binnen -1 en +1 standaarddeviatie van het gemiddelde. 95% valt binnen -2 en + 2 s van het gemiddelde. vrijwel alle observaties vallen binnen -3 en 3 s van het gemiddelde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

notatie gemiddelde populatie

A

mu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

notatie gemiddelde steekproef

A

y met dakje

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

standaarddeviatie populatie

A

sigma

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

standaarddeviatie steekproef

A

s

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

variantie populatie

A

sigma in het kwadraat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Variantie in steekproef

A

s in het kwadraat

17
Q

Waar is standaarddeviatie vooral bruikbaar?

A

Bij een normaalverdeling

18
Q

Wat is er zo belangrijk aan de normale verdeling?

A

veel verdelingen in de praktijk zijn ongeveer normaal verdeeld

uitkomsten van kansprocessen vaak vrijwel normaal verdeeld

nuttig bij bepaling van onzekerheidsmarges

19
Q

gebruik van spreidingsmaten bij scheve verdelingen

A

gebruik kwartielen, IQR, mediaan en modus (vaak bij sociale wetenschappen

20
Q

gebruik van spreidingsmaten bij symmetrische verdeling

A

gebruik standaarddeviatie, gemiddelde, IQR

21
Q

De hele verdeling beschrijven in getallen kan op 2 manieren

A

frequentieverdeling = volledige beschrijving

vijfpuntensamenvatting = kwartielen

22
Q

Hoe kan je de gehele verdeling visueel beschrijven

A

in een boxplot = 5punten samenvatting
histogram = frequentieverdeling
curve= benadering van histogram

23
Q

Hoe teken je een boxplot?

A

je hebt de 5 punten nodig
eerst teken je de kwartielen. Hiervan maak je een soort box. Daarna maak je het minimum en maximum afstand. snorharen teken je tot het minumum en maximym, behalve als ze meer dan 1,5 × IQR afwijken van q1 en q3 → zie powerpoint

24
Q

histogram

A
  • frequentieverdeling
  • weergave van alle geobserveerde gegevens

nadelen
- histogram meestal niet zo’n efficiënte samenvatting
- vorm verandert als je andere klassenindeling (streepjes) kiest

25
histogram benaderen met dichtheidscurve
Benaderen met een dichtheidscurve - benaderen van frequenties met een gladde curve die over de staafjes van het histogram past. Hierdoor heb je minder problemen. Curve beschrijft verloop van staven heel aardig. - dit is een efficiënte samenvatting - voor sommige verdelingen werkt dit goed, voor anderen minder goed voordeel =geeft aan welk deel van de scores in een bepaald interval vallen. Curve gaat niet over frequenties, maar kijkt per interval naar welk percentage er bij hoort nadeel = curve is wiskundig model Altijd boven de x-as Totale oppervlakte onder de curve is 1 of 100% geeft geen frequenties - y waarde niet interpreteerbaar - alleen naar oppervlaktes onder curve kijken
26
boxplot vs curve
boxplot en curve vatten de verdeling van scores samen. - boxplot kan altijd - curve is niet zo informatief als hij slecht past - curve onbetrouwbaar bij weinig data - curve kan goed representatie zijn voor populatieverdeling
27
centrummaten
centrum van de verdeling
28
spreidingsmaten
spreiding t.o.v. centrum.
29
z- scores
vooral handig bij normaal verdeelde variabelen namelijk, in dat geval, volgens de empirische regel, - ongeveer 95% van z-scores tussen -2 en 2 s - scores tussen -3 en 3 echt heel uitzonderlijk
30