Statistiek I Flashcards

Powerpoints (82 cards)

1
Q

Geef een voorbeeld van variabelen.

A

Lengte, leeftijd, haarkleur, batchnummer,….

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat is een variabele?

A

Een eigenschap die kan variëren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat is data?

A

Gevonden/gemeten waarden (realisaties) voor een variabele.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat is kwalitatief?

A

Niet nummeriek, categorieën

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat is kwantitatief?

A

Getallen waarbij bijv. het gemiddelde zinvol is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat is kwalitatieve data?

A

Omvat metingen die niet-numeriek zijn, maar in categorieën verdeeld kunnen worden. Bijvoorbeeld: Geslacht, kleur, merk,…

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat is kwantitatieve data?

A

Omvat numerieke metingen waar je zinvol een gemiddelde van kunt uitrekenen. Bijvoorbeeld: lengte, gewicht, temperatuur, aantallen,…

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Welke twee typen kwanitatieve variabelen zijn er?

A

Discreet en continu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat zijn discrete variabelen?

A

Variabelen die een eindig aantal waarden kunnen aannemen, maar ook variabelen die oneindig veel waarden kunnen aannemen maar die gelabeld kunnen worden met 1, 2, 3,…
Bijvoorbeeld: Aantal ongevallen op de A1, Aantal gasten op een concert, aantal misdaden gepleegd in Enschede in 2023.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat is continue data?

A

Variabelen die alle waarden in een bepaalde interval (of in bepaalde invallen) kunnen aannemen.
Bijvoorbeeld: Lengte, gewicht, temperatuur, aantallen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

In welke vier meetniveaus kan verzamelde data worden gerangschikt?

A

Nominaal, ordinaal, interval, ratio

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat is nominaal?

A

Afzonderlijke categorieën. De meetwaarden hebben een naam, maar de ene waarde is niet meer waard dan de andere (geen rangschikking).
Bijvoorbeeld: haarkleur, nationaliteit, politieke voorkeur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat is ordinaal?

A

Onderlinge volgorde, verdeeld in afzonderlijke categorieën die gerangschikt kunnen worden. Bijvoorbeeld: tentamencijfer in de VS (A, B, C, D, F), maten van kleding (S, M, L). Bij ordinale meetwaarden kun je spreken over een positief/negatief verschil.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat is interval?

A

Gelijke afstanden. Je kunt verschillen tussen meetwaarden uitrekenen, er is geen natuurlijk nulpunt, een temperatuur van 0 graden C betekent niet dat er geen warmte is. Je kunt niet zeggen dat het bij 30 graden C twee keer zo warm is als bij 15 graden C.
Bijvoorbeeld: Temperatuur in graden C.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat is ratio?

A

Absoluut nulpunt.
Je kunt verschillen tussen meetwaarden uitrekenen. De ene meetwaarde kan ‘‘twee keer zo groot’’ of ‘‘100 keer zoveel’’ zijn als een meetwaarde. Er is wel een natuurlijk nulpunt, de waarde ‘‘0’’ betekent dat er niets is.
Bijvoorbeeld: Gewicht, lengte, banksaldo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Welke meetniveaus hebben categorieën?

A

Nominaal, Ordinaal, Interval, Ratio

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Welke meetniveaus hebben een rangschikking?

A

Ordinaal, interval, ratio

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Welke meetniveaus hebben gelijke intervallen?

A

Interval, ratio

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Welke meetniveaus hebben een betekenisvol nulpunt?

A

Ratio

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Wat is het doel van beschrijvende statistiek?

A

Beschrijven en samenvatten van grote hoeveelheden ruwe data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Wat zijn de twee onderdelen van frequentieverdeling?

A

De categorieën of waarden van de metingen. En hoe vaak iedere meetwaarde voorkomt (=frequentie)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Wat is n?

A

Het aantal metingen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Wat is de absolute frequentie N(x)?

A

Aantal metingen van waarde x. Bijvoorbeeld: N(7) = 4.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Hoe bereken je de relatieve frequentie f(x)?

A

f(x) = N(x)/n, bijvoorbeeld f(7) = 4/20

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Wat zijn frequentiegrafieken?
Frequentieverdeling die visueel wordt weergegeven. Staafdiagrammen voor kwalitatieve data en histogrammen voor kwantitatieve data.
26
Wat is een staafdiagram?
Geschikt voor kwalitatieve data, de hoogte van een balk is gelijk aan het aantal metingen in de meetcategorie. Voor nominale data maakt volgorde van balken niet uit. Voor ordinale data is er wel een logische volgorde.
27
Wat is een histogram?
Geschikt voor kwantitatieve data. De hoogte van een balk is gelijk aan het aantal metingen op het interval van de balk. Altijd een logische volgorde van links naar rechts, want x-as is een getallenlijn.
28
Welke verdelingsvormen zijn er?
Symmetrische verdeling, Uniforme verdeling, Rechts-scheve verdeling, links-scheve verdeling.
29
Wat is een symmetrische verdeling?
De linker en rechterzijde van de verdeling zijn elkaars spiegelbeeld. ## Footnote Onthoud dat langs de x-as de meetwaarden staan en langs de y-as de frequentie van die meetwaarden.
30
Wat is een uniforme verdeling?
Alle gemeten waarden treden even vaak op. Uniforme verdelingen zijn altijd symmetrisch.
31
Wat is een rechts-scheve verdeling?
De staart van de verdeling ligt aan de rechter kant. We meten een groot aantal lage waarden en een klein aantal hoge waarden.
32
Wat is een links-scheve verdeling?
De staart van de verdeling ligt aan de linker kant. We meten een groot aantal hoge waarden en een klein aantal lage waarden.
33
Welke drie standaardmanieren zijn er om het centrum te berekenen? (= centrummaten)
De modus, de mediaan, het gemiddelde
34
Wat is de modus?
De meest voorkomende waarde in jouw metingen. In een frequentiegrafiek herken je de modus aan de piek van de verdeling.
35
Wat is de mediaan?
De middelste waarde als je al je metingen op volgorde van klein naar groot hebt gezet. De mediaan scheidt de metingen in de twee helften: 50% van de metingen ligt onder de mediaan en 50% van de metingen ligt boven de mediaan. Bij een even aantal metingen liggen er twee in het midden. De mediaan is de lagere van deze middelste waarden.
36
Wat is het gemiddelde?
De som van de metingen gedeeld door het aantal metingen.
37
Wat zijn de formules van het gemiddelde?
𝑥 ̅ = (x1 + x2 + ... + xn) / n 𝑥 ̅ = 1/n * ∑_(𝑖=1)^𝑛 * xi
38
Wat zijn spreidingsmaten?
Manieren om de variabiliteit van metingen te analyseren.
39
Welke drie spreidingsmaten leren wij?
Spreidingsbreedte, variantie, standaardafwijking (=standaarddeviatie)
40
Wat is de spreidingsbreedte?
Het verschil tussen de hoogste en laagste meetwaarde. Hoe groter de spreidingsbreedte, hoe groter de variatie in je meetwaarden.
41
Wat is variantie s^2?
Het ''gemiddelde'' verschil van de verschillen van ieder meetpunt. Hoe groter deze verschillen, hoe groter de variabiliteit in je meetwaarden.
42
Wat is de formule voor variantie?
𝑠^2=1/(𝑛−1) ∑_(𝑖=1)^𝑛▒〖(𝑥_𝑖−𝑥 ̅ )^2 " " 〗
43
Wat is de standaardafwijking?
De wortel van de variantie. Hoe groter de standaardafwijking, hoe groter de variabiliteit in je data.
44
Wat is de formule voor de standaardafwijking?
𝑠=√(1/(𝑛−1) ∑_(𝑖=1)^𝑛▒〖(𝑥_𝑖−𝑥 ̅ )^2 " " 〗)
45
Hoe bepaal je kwantielen?
Zet de meetwaarden op volgorde van klein naar groot, rond altijd af naar boven als de gezochte index tussen twee gehele getallen ligt. Dit wordt genoteerd met deze haakjes ⌈...⌉. De manier waarop je het reële getal a afrondt heet de ceiling-function ⌈a⌉.
46
Wat is het p-kwantiel x(p)?
De laagste gemeten waarde die p(%) van de data bedekt. Hierbij is p een fractie tussen 0 en 1, en dat kun je natuurlijk vertalen naar een percentage tussen 0% en 100%. Met andere woorden: Ten minste p(%) van de meetwaarden zijn kleiner of gelijk aan x(p). De waarde x(p) is de kleinste gemeten waarde met deze eigenschap.
47
Hoe bereken je het p-kwantiel?
x(p) = x-> ⌈p*n⌉
48
Wat zijn kwartielen en de 5-getallensamenvatting?
Q1 = x(0,25) = het eerste kwartiel Q2 = x(0,5) = het tweede kwartiel Q3 = x(0,75) = het derde kwartiel. xmin = minimaal xmax - maximaal
49
Hoe bereken je de interkwartielafstand (IQR)?
IQR = Q3 - Q1
50
Wat is de interkwartielafstand?
De spreiding van de middelste 50% van de data.
51
Wat is het verschil tussen de s (standaardafwijking) en IQR?
IQR is niet gevoelig voor uitschieters
52
Hoe spoor je uitschieters op?
Met de IQR-methode. Met de 2s-methode
53
Wat is de IQR-methode bij uitschieters?
Uitschieters zijn alle metingen die buiten het volgende interval liggen: [Q1-1,5*IQR; Q3 + 1,5 * IQR]
54
Wat is de 2s-methode bij uitschieters?
Uitschieters zijn alle metingen die buiten het volgende interval liggen: [x-> - 2 * s; x-> + 2 * s)
55
Hoe teken je een boxplot?
De randen van de box van een boxplot zijn gegeven door de kwartielen Q1 en Q3. In de box staat een lijn die de mediaan (Q2) aangeeft. Verder bevat een boxplot zogenaamde whiskers (''snorharen''). Als er geen uitschieters zijn, lopen de whiskers tot het minimum en het maximum. Als er wel uitschieters zijn, dan lopen de whiskers tot de uiterste gemeten waarden die binnen het al bekende IQR interval vallen. Alle meetwaarden die buiten dit interval vallen, worden met een punt getekend. De afstand van de box tot de getallenlijn is niet belangrijk.
56
Wat is het verschil tussen een steekproef en populatie?
Bij een steekproef test je een willekeurig aantal gekozen ''dingen'', populatie is het complete aantal.
57
Wat is een kansexperiment?
Een experiment waarbij de uitkomst niet met zekerheid voorspeld kan worden. Voorbeelden: Werpen van een dobbelsteen, spelen van de lotto, kiezen van een willekeurige persoon uit een populatie, kiezen van een willekeurige trui bij het aankleden.
58
Wat is een verzameling?
Een set van afzonderlijke objecten.
59
Wat zijn elementen?
Objecten van de verzameling.
60
Hoe geef je aan dat het om een verzameling gaat?
Accolades { en }
61
Hoe geef je een lege verzameling aan?
{} of ∅
62
Wat is ''∈''?
Betekent ''is een element van''. Met een streep erdoor betekent ''is geen element van''.
63
Wat is een deelverzameling?
Wanneer elk element van A ook in B zit (verzameling A is dan een deelverzameling van B).
64
Hoe noteer je dat iets een deelverzameling is van?
⊆ Voorbeeld: {bruin, zwart} ⊆ {bruin, zwart, blauw}
65
Wat zijn voorbeelden van uitkomstenruimtes?
Werpen van een dobbelsteen kan 1 t/m 6 opleveren: S = {1, 2, 3, 4, 5, 6} Opgooien van een munt kan kop of munt opleveren: S = {K, M}
66
Wat is P(S)?
Machtsverzameling
67
Wat zijn S en P(S) wanneer je willekeurig kiest tussen een rode en witte sjaal?
S = {rood, wit}, P(S) = {∅ {r}, {w}, {r, w}}
68
Wat is een gekoppeld kansexperiment?
Bestaat uit een aantal kansexperimenten die na elkaar uitgevoerd worden. Bijvoorbeeld: Eerst een munt opgooien, daarna een dobbelsteen werpen.
69
Hoe vind je alle mogelijke uitkomsten van een gekoppeld kansexperiment?
Door het product van verzamelingen uit te rekenen.
70
Wat is ∩?
Dat het voor de ∩ en er na tegelijk optreden.
71
Wat is de doorsnede?
Wanneer A en B alle elementen bevat die zowel in A als in B zitten.
72
Wat is disjunct?
Wanneer er geen overlap is tussen A en B.
73
Wat is de vereniging van twee gebeurtenissen?
∪, wanneer gebeurtenis A of B plaatsvindt. De vereniging van A en B bevat alle elementen die in A en/of B zitten.
74
Wat is \?
Het verschil tussen twee gebeurtenissen. Dat gebeurtenis A wel plaatsvindt, maar B niet.
75
Wat is het complement van een gebeurtenis?
^c. Is de gebeurtenis dat A niet plaatsvindt. In het complement van A in S, bevat het complement alle elementen die wel in S zitten maar niet in A.
76
Wat zijn elementaire gebeurtenissen?
Gebeurtenissen met maar 1 element.
77
Wanneer S = {1, 2, 3, 4, 5, 6}, hoe groot is de kans op 1 van die elementen? Hoe groot is de kans op twee van die elementen? Hoe groot is de kans op een even aantal ogen groter dan 3?
1 element: 1/6 2 elementen: 2/6 Even aantal ogen groter dan 3: 2/6
78
Wat is de formule van Laplace?
Kans op gebeurtenis A = aantal elementen in gebeurtenisverzameling A / aantal elementen in uitkomstenruimte S
79
Wanneer werkt Laplace?
Als iedere elementaire gebeurtenis uit S even waarschijnlijk is.
80
Hoe noteer je ''kans op gebeurtenis A'' kort bij Laplace?
ℙ(𝐴)
81
Hoe noteer je ''het aantal elementen in verzameling A'' voor Laplace?
|A|
82
Hoe kan de formule van Laplace kort genoteerd worden?
ℙ(𝐴) = |A| / |S|