Biostatistiek 1 Flashcards
(21 cards)
wat zijn continue variabelen?
Continue variabelen zijn variabelen zoals gewicht en lengte en kunnen dus een oneindig aantal waarden hebben.
wat zijn dichotome variabelen?
Alleen ja/nee of 0/1 – zoals “ziek/niet ziek”, “overleden/niet overleden”.
wat zijn categoriale variabelen?
Je zit in een bepaalde groep – zoals beroep of opleidingsniveau.
Wat betekent het gemiddelde als centrummaat en wat zijn de voor en nadelen hiervan?
Bonus vraag: wanneer zou je dit kunnen gebruiken?
Alles optellen en delen door het aantal getallen.
➤ Voordeel: gebruikt alle data.
➤ Nadeel: wordt verstoord door uitschieters.
🧠 Gebruik dit als je data ongeveer symmetrisch zijn.
Wat betekent de mediaan als centrummaat en wat zijn de voor en nadelen?
en wat is een formule hiervoor?
Het middelste getal als je alles op volgorde zet.
➤ Voordeel: niet gevoelig voor uitschieters.
➤ Nadeel: negeert de rest van de data.
(n+1) / 2
n = aantal getallen
–> Hierbij moet je kijken naar dat getal dus bv (3+1) /2 = 2 dus je moet kijken naar het tweede getal!
wanneer kun je geen mediaan uitrekenen?
Wanneer de getallenreeks even is, is er strikt gezien geen mediaan. Echter wordt deze dan vaak alsnog berekend als het gemiddelde van de twee middelste observaties.
wat is modus?
➤ Het getal dat het vaakst voorkomt.
➤ Niet vaak gebruikt in onderzoek.
wanneer gebruik je Geometrisch gemiddelde?
Het geometrisch gemiddelde wordt gebruikt wanneer de dataset scheef verdeeld is naar rechts.
hoe wordt een geometrisch gemiddelde uitgerekend?
Om het geometrische gemiddelde uit te rekenen wordt een logaritmische transformatie van de oorspronkelijke variabele toegepast. Deze logtransformatie is alleen succesvol als deze een normaalverdeling creëert.
De verdeling is na de logtransformatie normaal verdeeld als het geometrische gemiddelde gelijk is aan de mediaan en minder is dan het gemiddelde van de ruwe data. Het geometrische gemiddelde is dus alleen van toepassing als de logtransformatie een normaalverdeling creëert.
hoe bereken je geometrische verdeling?
Stel, je hebt de volgende percentuele groeifactoren
Waarden: 1.10, 0.95, 1.05, 1.20
🔹 Stap 1: Neem van elk getal de natuurlijke logaritme (ln)
Bijvoorbeeld:
ln(1.10) ≈ 0.095
ln(0.95) ≈ -0.051
ln(1.05) ≈ 0.049
ln(1.20) ≈ 0.182
🔹 Stap 2: Bereken het gemiddelde van die log-waarden
( 0.095+(−0.051)+0.049+0.182 ) / 4
= 0.275 / 4 = 0.069
🔹 Stap 3: Neem de exponent (e^) van dat gemiddelde
e^0.069 ≈ 1.0715
Dus het geometrisch gemiddelde is ongeveer 1.0715, oftewel een gemiddelde groei van 7.15% per stap.
Wat betekent het gewogen gemiddelde en hoe bereken je dit?
Bij het gewogen gemiddelde wordt gekeken naar de belangrijkheid van de variabelen. Als bepaalde variabelen belangrijker zijn, wegen deze meer mee. Elke variabele (v) wordt vermenigvuldigd met het gewicht (w)
Dus in plaats van alleen percentages gemiddeld te nemen doe je dit keer het aantal mensen per percentage dus 90 * 85% geslaagden vwo’ers
Wat betekent: Range, percentielen, kwartielen en interkwartielafstand (IQR)
Range = hoogste - laagste waarde
Percentielen = verdelen de data in 100 stukjes
Kwartielen = verdelen de data in vier gelijke stukken
Interkwartielafstand (IQR) = verschil tussen 25e en 75e percentiel
➤ Dit is de ‘midden 50%’ van je data.
Wat betekent standaard deviatie en hoe bereken je dit?
Laat zien hoeveel de waardes gemiddeld afwijken van het gemiddelde.
SD = √(variantie² ) = √[som van alle (afwijking)² gedeeld door (n-1)]
bv:
Stel er zijn zeven personen in een dataset met leeftijden 40, 41, 42, 43, 44, 45 en 46 jaar. De gemiddelde leeftijd is dan gelijk aan:
(40+41+42+43+44+45+46) / 7= 43
De bijbehorende variantie is:
S2= ((40- 43)2 + (41-43)2 + (42-43)2 + (43-43)2 + (44-43)2 + (45-43)2 + (46-43)2) / (7-1) = ((-3)2 + (-2)2 + (-1)2+ (0)2 + (1)2 + (2)2 + (3)2) / 6=286= 4,67
De standaarddeviatie is:
sd = √4,67 = 2,16
Hoe bereken je variantie?
∑(xi-x)-2 / (n-1)
xi = steekproefwaarden
x̅ = het gemiddelde van de waarden in de reeks
n = steekproefgrootte.
hoe kun je zien dat de data niet symmetrisch is?
Als het verschil tussen het gemiddelde en mediaan groot is, wijst dit dus op een niet-symmetrische (scheve) verdeling.
wat zijn de standaard deviaties bij een normaal verdeling?
Als het echt normaal verdeeld is:
➤ 68% zit binnen ±1 SD
➤ 95% zit binnen ±2 SD
➤ 99,7% zit binnen ±3 SD
Hoe werkt de standaard deviatie?
Hoe groter de standaarddeviatie van de individuele verschilscores, des te minder betrouwbaar het gevonden onderzoeksresultaat zal zijn.
Hiermee wordt bedoeld dat het lastiger is om het resultaat te vertalen naar de rest van de doelpopulatie
Wat betekent de standard error of the mean? En wat betekent een grote SEM of lage SEM?
de standard error of the mean (SEM). De standaardfout van het gemiddelde geeft de precisie van het gemiddelde weer. Een grote standaardfout wijst op onbetrouwbaarheid van de waardebepaling. Een kleine standaardfout laat zien dat de waardebepaling precies en betrouwbaar is
Hoe bereken je de SEM?
SEM = SD / √n
(n = het aantal proefpersonen in de onderzoekspopulatie)
wat is het verschil in de illustratie van de standaard deviatie en SEM?
De standaarddeviatie laat de spreiding in de dataset zien en wordt gebruikt als de voorkeur is om de variabiliteit in de data te illustreren.
De standaardfout van het gemiddelde geeft de precisie van het gemiddelde weer en wordt gebruikt om de betrouwbaarheid van het gevonden onderzoeksresultaat te meten.
hoe bereken je de betrouwbaarheidsinterval?
95% BI = μ ± 1,96 * σ / √n
μ = Het gemiddelde van de steekproef
σ = De standaarddeviatie van de steekproef
n = Het aantal observaties (steekproefgrootte)
1,96 = Getal dat hoort bij een 95% betrouwbaarheid (bij normale verdeling)
Dit is alleen zo bij een normale verdeling!
bv:
Bij 35 mensen is een BMI meting gedaan. Het gemiddelde BMI van de populatie is gelijk aan 27 en de standaarddeviatie is gelijk aan 4. Het 95% betrouwbaarheidsinterval rond het gemiddelde van de steekproef is dan als volgt te berekenen:
95% BI = 27 ± 1,96 * 4 / √35= 27 ± 1,33
Er kan dus met 95% zekerheid worden aangenomen dat het populatiegemiddelde tussen de 25,67 en 28,33 ligt.