College 2a Flashcards
(30 cards)
Q1
de eerste 25% van de observaties, ook mediaan van eerste helft van de scores
Q3
tot 75% van de observaties, ook mediaan van de tweede helft van de scores
Spreidingsmaten
- range
- interkwartielrange (verschil q1 en q3)
- gemiddeld absolute afwijking
- variantie/standaarddeviatie
Range
afstand tussen minimum en maximum score
Range = maximum - minimum
Interkwartielrange (IQR)
Afstand tussen q1 en q3, range van middelste 50% van de scores
gemiddelde absolute afwijking
spreiding als afwijking van het gemiddelde
absolute waarde
grote van het getal, zonder - als die er is
waarom gebruiken we gemiddelde absolute afwijking meestal niet, en wat doen we dan wel?
de gaa is wiskundig minder bruikbaar. Daarom gebruiken we de standaarddeviatie, of ook wel standaardafwijking genoemd. Deze gebruikt niet de absolute afwijking, maar de gekwadrateerde afwijking.
Eigenschappen standaarddeviatie
nooit negatief
bij 0 spreiding zijn alle gegevens hetzelfde
hoe meer variabiliteit in de scores, hoe hoger de standaarddeviatie
Als verdeling belvormig of symmetrisch is, geld de empirische regel.
empirische regel
ongeveer 68% van de scores valt binnen -1 en +1 standaarddeviatie van het gemiddelde. 95% valt binnen -2 en + 2 s van het gemiddelde. vrijwel alle observaties vallen binnen -3 en 3 s van het gemiddelde
notatie gemiddelde populatie
mu
notatie gemiddelde steekproef
y met dakje
standaarddeviatie populatie
sigma
standaarddeviatie steekproef
s
variantie populatie
sigma in het kwadraat
Variantie in steekproef
s in het kwadraat
Waar is standaarddeviatie vooral bruikbaar?
Bij een normaalverdeling
Wat is er zo belangrijk aan de normale verdeling?
veel verdelingen in de praktijk zijn ongeveer normaal verdeeld
uitkomsten van kansprocessen vaak vrijwel normaal verdeeld
nuttig bij bepaling van onzekerheidsmarges
gebruik van spreidingsmaten bij scheve verdelingen
gebruik kwartielen, IQR, mediaan en modus (vaak bij sociale wetenschappen
gebruik van spreidingsmaten bij symmetrische verdeling
gebruik standaarddeviatie, gemiddelde, IQR
De hele verdeling beschrijven in getallen kan op 2 manieren
frequentieverdeling = volledige beschrijving
vijfpuntensamenvatting = kwartielen
Hoe kan je de gehele verdeling visueel beschrijven
in een boxplot = 5punten samenvatting
histogram = frequentieverdeling
curve= benadering van histogram
Hoe teken je een boxplot?
je hebt de 5 punten nodig
eerst teken je de kwartielen. Hiervan maak je een soort box. Daarna maak je het minimum en maximum afstand. snorharen teken je tot het minumum en maximym, behalve als ze meer dan 1,5 × IQR afwijken van q1 en q3 → zie powerpoint
histogram
- frequentieverdeling
- weergave van alle geobserveerde gegevens
nadelen
- histogram meestal niet zo’n efficiënte samenvatting
- vorm verandert als je andere klassenindeling (streepjes) kiest