Biostatistiek 1 Flashcards

(21 cards)

1
Q

wat zijn continue variabelen?

A

Continue variabelen zijn variabelen zoals gewicht en lengte en kunnen dus een oneindig aantal waarden hebben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

wat zijn dichotome variabelen?

A

Alleen ja/nee of 0/1 – zoals “ziek/niet ziek”, “overleden/niet overleden”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

wat zijn categoriale variabelen?

A

Je zit in een bepaalde groep – zoals beroep of opleidingsniveau.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat betekent het gemiddelde als centrummaat en wat zijn de voor en nadelen hiervan?

Bonus vraag: wanneer zou je dit kunnen gebruiken?

A

Alles optellen en delen door het aantal getallen.

➤ Voordeel: gebruikt alle data.
➤ Nadeel: wordt verstoord door uitschieters.

🧠 Gebruik dit als je data ongeveer symmetrisch zijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat betekent de mediaan als centrummaat en wat zijn de voor en nadelen?

en wat is een formule hiervoor?

A

Het middelste getal als je alles op volgorde zet.

➤ Voordeel: niet gevoelig voor uitschieters.
➤ Nadeel: negeert de rest van de data.

(n+1) / 2
n = aantal getallen
–> Hierbij moet je kijken naar dat getal dus bv (3+1) /2 = 2 dus je moet kijken naar het tweede getal!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

wanneer kun je geen mediaan uitrekenen?

A

Wanneer de getallenreeks even is, is er strikt gezien geen mediaan. Echter wordt deze dan vaak alsnog berekend als het gemiddelde van de twee middelste observaties.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

wat is modus?

A

➤ Het getal dat het vaakst voorkomt.
➤ Niet vaak gebruikt in onderzoek.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

wanneer gebruik je Geometrisch gemiddelde?

A

Het geometrisch gemiddelde wordt gebruikt wanneer de dataset scheef verdeeld is naar rechts.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

hoe wordt een geometrisch gemiddelde uitgerekend?

A

Om het geometrische gemiddelde uit te rekenen wordt een logaritmische transformatie van de oorspronkelijke variabele toegepast. Deze logtransformatie is alleen succesvol als deze een normaalverdeling creëert.

De verdeling is na de logtransformatie normaal verdeeld als het geometrische gemiddelde gelijk is aan de mediaan en minder is dan het gemiddelde van de ruwe data. Het geometrische gemiddelde is dus alleen van toepassing als de logtransformatie een normaalverdeling creëert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

hoe bereken je geometrische verdeling?

A

Stel, je hebt de volgende percentuele groeifactoren
Waarden: 1.10, 0.95, 1.05, 1.20

🔹 Stap 1: Neem van elk getal de natuurlijke logaritme (ln)
Bijvoorbeeld:

ln(1.10) ≈ 0.095

ln(0.95) ≈ -0.051

ln(1.05) ≈ 0.049

ln(1.20) ≈ 0.182

🔹 Stap 2: Bereken het gemiddelde van die log-waarden
( 0.095+(−0.051)+0.049+0.182 ) / 4
= 0.275 / 4 = 0.069

🔹 Stap 3: Neem de exponent (e^) van dat gemiddelde
e^0.069 ≈ 1.0715

Dus het geometrisch gemiddelde is ongeveer 1.0715, oftewel een gemiddelde groei van 7.15% per stap.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat betekent het gewogen gemiddelde en hoe bereken je dit?

A

Bij het gewogen gemiddelde wordt gekeken naar de belangrijkheid van de variabelen. Als bepaalde variabelen belangrijker zijn, wegen deze meer mee. Elke variabele (v) wordt vermenigvuldigd met het gewicht (w)

Dus in plaats van alleen percentages gemiddeld te nemen doe je dit keer het aantal mensen per percentage dus 90 * 85% geslaagden vwo’ers

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat betekent: Range, percentielen, kwartielen en interkwartielafstand (IQR)

A

Range = hoogste - laagste waarde

Percentielen = verdelen de data in 100 stukjes

Kwartielen = verdelen de data in vier gelijke stukken

Interkwartielafstand (IQR) = verschil tussen 25e en 75e percentiel
➤ Dit is de ‘midden 50%’ van je data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat betekent standaard deviatie en hoe bereken je dit?

A

Laat zien hoeveel de waardes gemiddeld afwijken van het gemiddelde.

SD = √(variantie² ) = √[som van alle (afwijking)² gedeeld door (n-1)]

bv:
Stel er zijn zeven personen in een dataset met leeftijden 40, 41, 42, 43, 44, 45 en 46 jaar. De gemiddelde leeftijd is dan gelijk aan:
(40+41+42+43+44+45+46) / 7= 43

De bijbehorende variantie is:
S2= ((40- 43)2 + (41-43)2 + (42-43)2 + (43-43)2 + (44-43)2 + (45-43)2 + (46-43)2) / (7-1) = ((-3)2 + (-2)2 + (-1)2+ (0)2 + (1)2 + (2)2 + (3)2) / 6=286= 4,67

De standaarddeviatie is:
sd = √4,67 = 2,16

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hoe bereken je variantie?

A

∑(xi-x)-2 / (n-1)
xi = steekproefwaarden
x̅ = het gemiddelde van de waarden in de reeks
n = steekproefgrootte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

hoe kun je zien dat de data niet symmetrisch is?

A

Als het verschil tussen het gemiddelde en mediaan groot is, wijst dit dus op een niet-symmetrische (scheve) verdeling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

wat zijn de standaard deviaties bij een normaal verdeling?

A

Als het echt normaal verdeeld is:
➤ 68% zit binnen ±1 SD
➤ 95% zit binnen ±2 SD
➤ 99,7% zit binnen ±3 SD

14
Q

Hoe werkt de standaard deviatie?

A

Hoe groter de standaarddeviatie van de individuele verschilscores, des te minder betrouwbaar het gevonden onderzoeksresultaat zal zijn.

Hiermee wordt bedoeld dat het lastiger is om het resultaat te vertalen naar de rest van de doelpopulatie

15
Q

Wat betekent de standard error of the mean? En wat betekent een grote SEM of lage SEM?

A

de standard error of the mean (SEM). De standaardfout van het gemiddelde geeft de precisie van het gemiddelde weer. Een grote standaardfout wijst op onbetrouwbaarheid van de waardebepaling. Een kleine standaardfout laat zien dat de waardebepaling precies en betrouwbaar is

16
Q

Hoe bereken je de SEM?

A

SEM = SD / √n
(n = het aantal proefpersonen in de onderzoekspopulatie)

17
Q

wat is het verschil in de illustratie van de standaard deviatie en SEM?

A

De standaarddeviatie laat de spreiding in de dataset zien en wordt gebruikt als de voorkeur is om de variabiliteit in de data te illustreren.

De standaardfout van het gemiddelde geeft de precisie van het gemiddelde weer en wordt gebruikt om de betrouwbaarheid van het gevonden onderzoeksresultaat te meten.

18
Q

hoe bereken je de betrouwbaarheidsinterval?

A

95% BI = μ ± 1,96 * σ / √n

μ = Het gemiddelde van de steekproef
σ = De standaarddeviatie van de steekproef
n = Het aantal observaties (steekproefgrootte)
1,96 = Getal dat hoort bij een 95% betrouwbaarheid (bij normale verdeling)

Dit is alleen zo bij een normale verdeling!

bv:

Bij 35 mensen is een BMI meting gedaan. Het gemiddelde BMI van de populatie is gelijk aan 27 en de standaarddeviatie is gelijk aan 4. Het 95% betrouwbaarheidsinterval rond het gemiddelde van de steekproef is dan als volgt te berekenen:

95% BI = 27 ± 1,96 * 4 / √35= 27 ± 1,33

Er kan dus met 95% zekerheid worden aangenomen dat het populatiegemiddelde tussen de 25,67 en 28,33 ligt.