Hoofdstuk 2: Beschrijvende Statistiek Flashcards

(44 cards)

1
Q

Absolute frequentie

A

Nj
Aantal uitkomsten xi in de steekproef telling die gelijk zijn aan mj

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Relatieve frequentie

A

Fj,n
= steekproefproporties
Nj/n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Staafdiagram

A

Mogelijke uitkomsten = horizontale as
Fj,n of nj = verticale as
De balken raken elkaar niet aan
‘Hoe waarschijnlijk de overeenkomstige uitkomst I’d binnen de genomen steekproef
Opp. Heeft geen betekenis!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Taartdiagram

A

Fj,n van uitkomsten steekproef bepaalt hoe de taart wordt verdeeld
Kwantitatieve/eindig aantal gegevens

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Discretisatie/groepering van gegevens

A

Oplossing voor continue/discrete variabelen met oneindig aantal elementen
Indeling per klasse: klassenbreedte Δ
Mj = klassenmiddens

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Histogram

A

Horizontale as: klassenbreedte Δ
Verticale as: af nj of rd nj/n of frequentiedichtheid hj =fj,n/Δj = nj/Δjn
Tot. Opp = 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Symmetrische verdeling

A

Gedragen zich op dezelfde wijze aan de linkse en rechts zijde van de figuur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Normale verdeling

A

Klokcurve
Hoe groter steekproef hoe duidelijker normaal verdeling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Scheve (niet-symmetrische verdeling)

A

A zijde zwakt meer af dan de andere.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

bimodale verdeling

A

Duidelijk twee doelgroepen te zien in histogram, 2 toppen (modi).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

uitschieter?

A

getal dat te klein of te groot is, en dus niet bij de overgrote meerderheid van de getallen past.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

cumulatieve verdelingsfunctie

A

alternatief voor frequentietabellen
uitkomsten van het experiment die kleiner zijn dan of gelijk zijn aan x.
trap grafiek, waar treden niet geconnecteerd zijn!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

empirische verdelingsfunctie

A

functie wordt berekend op basis van een steekproef

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

kwantiel functie

A

Qn
gegeven een bepaald percentage 0<p<1, welk reëel getal x situeert zich dan in de overeenkomstige positie in de steekproef?
inverse functie van de cumulatieve verdelingsfunctie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Q1, Q2, Q3?

A

Qn(O,25), Qn(0,50), Qn(O,75)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

steekproefgemiddelde

A

x (met streep)
erg gevoelig voor uitschieters
niet nominaal en ordinaal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

mediaan

A

alternateif gemiddelde
middelste waarde van geordende steekproef.
niet nominaal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

modus

A

element uit de uitkomstenverzameling dat het meest voorkomt in de steekproef, hoogste frequentie
wel nominaal

19
Q

bereik

A

spreidingsmaat
afstand tussen grootste x(n) en kleinste waarneming x(1): R=X(n)-X(1)
te weinig info

20
Q

standaardafwijking/steekproefstanddaarddeviatie

A

maat voor de spreiding van een variabele of van een verdeling of populatie. de wortel uit de variantie

21
Q

variantie

A

Hoe groter de variantie, hoe meer de afzonderlijke waarden onderling verschillen, en dus ook hoe meer de waarden van het “gemiddelde” afwijken

22
Q

normale verdeling, regel 2/3

A

2/3 van de gegevens ligt binnen een afstand van 1 standaarddeviatie aan weerszijden van het steekproefgemiddelde

23
Q

normale verdeling, 95 %

A

95% van de gegevens ligt binnen een afstand van 2 standaarddeviaties aan weerszijden van het steekproefgemiddelde.

24
Q

interkwartielafstand IQR

A

geeft lengte van gebied rond de mediaan dat +- 1/2 van gegevens bevat.
minder gevoelig voor uitschieters
Qn(0,75)-Qn(0,25)

25
IQR/s?
als n voldoende groot is = 1,34
26
boxplot
gemiddelde, mediaan, kwartielen en kleiste/grootste waarde op schemtatische wijze voor stellen. nadeel: bimodale verdeling wordt niet getoond
27
linksscheve verdeling boxplot
mediaan in in bovenste helft onderste whisker is langer
28
rechtsscheve verdeling in boxplot
mediaan in onderste helft bovenste whisker is langer
29
lineaire transformaties
vaak gebruikt bij omzetten van meeteenheden g(xi) = a+bx Het verschiven heeft geen invloed op de spreidingsmaat!
30
verband tussen 2 kwalitatieve variabelen
kruistabel met absolute frequenties of relatieve frequenties. Er wordt een rij en kolom totaal toegevoegd. grafisch via staafdiagram
31
verband kwantiatieve en kwalitatieve variabele
kruistabel of bei oneindig verzameling -> histogrammen, verdelingsfunctie, boxplot..
32
verband tussen 2 kwantitatieve variabelen
bivariate histogram, puntenwolk of spreidingsdiagram (scatterplot)
33
positieve associatie?
stijgende Y met stijgende X
34
negatieve associatie
dalende Y met dalende X
35
sterke associatie
punten liggen dicht bij elkaar er is afhankelijkheid tussen de 2 variabelen
36
zwakke associatie
punten liggen ver weg van elkaar geen afhankelijkheid tussen de 2 variabelen
37
steekproefcovariantie
vertelt je over richting puntenwolk. Puntenwolk stijgt = meer punten een positieve score puntenwolk daalt = meer punten een negatieve score.
38
pearson correlatiecoëfficient
maat van lineaire associatie, zonder betrekking op meeteenheid. -1
39
y = a+bx
x = verklarend/ onafhankelijke variabele y = responsvariabele b = rico a = intercept
40
rico?
hoe y wijzigt indien X met 1 eenheid toeneemt
41
intercept?
a levert de waarde voor y bij x = 0
42
kleinste kwadratenmethode
Een techniek om de best passende lijn te vinden in een scatterplot door de totale kwadraatsom van de verschillen (residuen) tussen de geobserveerde waarden en de voorspelde waarden van de lijn te minimaliseren. Het doel is een rechte lijn te bepalen die de relatie tussen een onafhankelijke (x) en afhankelijke variabele (y) zo nauwkeurig mogelijk beschrijft
43
determinatiecoëfficiënt
Een maat voor hoe goed een regressiemodel de variatie in de afhankelijke variabele verklaart. Het ligt tussen 0 en 1: R² = 1: Perfecte voorspelling. R² = 0: Geen enkele variatie verklaard. Hoe dichter bij 1, hoe beter het model de data past.
44
lineaire combinaties
twee of meer variabelen. V = a+bX=cY