Statistiek termen Flashcards
(183 cards)
Verschil tussen willekeurige variatie in gedrag en bias (vertekening / vooringenomenheid) en waarom is bias een veel groter probleem?
Random variation - willekeurige variatie is variatie door toeval.
Bias is een systematische afwijking waardoor deze minder opvalt niet identiiceerbaar is door statistische technieken en niet niet corrigeerbaar is door gemiddelde.
Bij willekeurige variate / fouten vermindert de kans op statisch significante resultaten door meer vaiabiliteit in de resultaten.
Bij bias kan men de foute conclusie trekken dat de hypothese ondersteund werd door de resutlaten terwijl deze waargenomen resultaten te wijten zijn aan factoren irrelevant van de hypothesis.
Hierdoor wordt een bias als het ergst van de twee beschouwd.
Items in een meetinstrument?
In een meetinstrument wordden constructen gemeten met verschillende items of stimuli die samen het betreffende construct omvatten.
Items /stimuli kunnen
- uitspraken zijn, (waarop gereageerd kan worden)
- vragen, (waarop gereageerd kan worden) ,
- taken en
- observaties
Meestal bestaan meetinstrumenten uit meerdere stimuli /items en de daarbij behorende registraties van de reacties van deelnemers.
Zijn er in een meetmodel voor een manipulatie over het algemeen meerdere indicatoren? En waarom?
Neen want Meetmodellen worden meestal opgesteld voor meetinstrumenten (vb test / vragenlijst) want bij manipulaties (experiment) worden deelnemers vaak maar blootgesteld aan een stimulus / indicator.
Z-verdeling
= Een standaard normale verdeling = een normaalverdeling met een gemiddelde van nul en een standaarddeviatie van 1
= Z-verdeling
= handig want van elk datapunt in een z-verdeling is het duidelijk hoe ver het punt van het gemiddelde ligt
Welsh t versus students t
Welsh T = t toets voor ongelijke varianties
T-toets (regulier of student) = t toet voor gelijke varianties
Welsh T is altijd beter want strenger
Spreidingsmaten - welke en waarvoor worden ze gebruikt?
Spreidingsmaten: de spreiding van de data wordt gerapporteerd om een goed beeld te geven van een datareeks.
- Range (bereik): verschil tss Max en Min = zeer gevoelig voor outliers
- Interkwartielafstand (IQR): data ordenen van laag naar hoog en vervolgens opsplitsen in kwartielen (25% - 1 e kwartiel, 50% = mediaan, 75% 3 de kwartiel). IQR = afstand tss 1 e en 3 de kwartiel)
- SS - Sum of Squares : Variatie (som vd gekwadrateerde afwijkingen vh gemiddelde) - kwadrateren omdat ze allemaal pos moeten zijn om ze bij elkaar op te kunnen tellen. Nadeel: de variatie wordt steeds groter naarmate er datapunten bijkomen, zelfs als deze die er bijkomen dicht bij het gemiddelde liggen. De spreiding wordt niet noodzakelijk meer dus beter is:
- MS - Mean Squares = Variantie = SS / aantal datapunten min 1 = gemiddelde van de SS = Voordeel: houdt rekening met aantal datapunten. Nadeel: niet dezelfde schaal als de data in de datareeks (gekwadrateerd)
- Std Deviatie (std afwijking) = wortel van de variantie (van de MS) = geeft de gemiddelde afwijking van het gemiddelde weer. Voordeel: dezelfde schaal als de data in de datareeks
SS grootst, MS tweede grootst en Std dev kleinst
Centrum maten - welke en waarvoor worden ze gebruikt?
Centrummaten: gebruikt om data mee samen te vatten. ze geven op verschillende manieren het “centrum” van een bepaalde datareeks aan.
- Gemiddelde: totaal van al de scores gedeeld door aantal scores
- Mediaan (rangschikken van laag naar hoog en middelste datapunt of gemiddelde vd 2 middelste datapunten bij even aantal)
- Modus: waarde die het vaakst voorkomt - vooral informatief bij beperkt aantal mogelijke waardes of bij een grote hoeveelheid datapunten
Modus en mediaan zijn echt geobserveerde waardes, het gemiddeldde niet.
Het gemiddelde wordt ook vaak gebruikt om de score van een individu op een vragenlijst over een psychologisch concept samen te vatten. Bijvoorbeeld, om burn-out te meten, beantwoorden deelnemers meerdere vragen die gaan over emotionele uitputting, vermoeidheid, hopeloosheid en cynisme op een schaal van 1 (nooit) tot 5 (altijd). Per deelnemer kan vervolgens een gemiddelde score op de burn-outschaal worden berekend door de scores van alle items op te tellen en te delen door het aantal items.
P-waarde: Welke zijn de aandachtspunten bij de P-waarde?
- Statistische significantie is iets anders dan relevantie: vb. paar duizenden ondervragen maar klein verschil – er is een verschil maar misschien niet relevant (klein effect niet belangrijk)
- Hoe groter de steekproef, des te kleiner de P waarde en is het resultaat eerder statistisch significant. Toets wordt berekend door verschillen in deelnemer aantal , bij een grotere steekproef is het verschil / verband rapper significant omdat je gewoon veel meer aantallen getest hebt.
- P-waarde zegt niets over de aan – of afwezigheid van vertekeningen in het onderzoek (slecht onderzoek kan ook een P waarde aangeven – niet altijd zinvol)
- P-waarde (0.05 of 5 % kan door elkaar gebruikt worden)
- P-waarde altijd samen bekijken met andere statistieken zoals effect grootte en BI
Welke zijn de 2 soorten operationalisaties?
- Meetinstrument:
- Op consistente wijze een variabele kwantificeren
- NIET beinvloeden
- Gebruikt om constructen (naam en definitie van variabelen) te meten met verschillende items (stimuli) die samen het betreffende construct omvatten (vb items = uitspraken, taken, observaties)
- Meetwaarden = de waarden die bepaald kunnen worden mbv een operationalisatie (vb puntenschaal van 1 - 7 , waarden zijn dan 1-7)
- Datareeks afkomstig van eenzelfde meetinstrument = variabele (de term variabele wordt dus zowel gebruikt voor een theoretische variabele (bvb leervaardigheid) als voor een reeks datapunten die indicatief is voor de waarde van deze theoretische variabele
- Manipulaties:
- WEL beinvloeden van een construct
- Door manipuleren van variabelen in (quasi) experimenteel onderzoek kan onderzocht worden of er een causaal verband bestaat tss 2 variabelen
- Er worden stimuli aan deelnemers gepresenteerd om een bepaalde toestand van of een verandering in het contruct te veroorzaken
Meetinstrumenten zijn ontwikkeld om een specifiek construct te meten terwijl manipulaties werden ontwikkeld om een specifiek contruct (of soms een combinatie van constructen) te beïnvloeden.
Alle operationalisaties, of het nu meetinstrumenten zijn of manipulaties resulteren per onderzoekseenheid in een datapunt per variabele. Binnen elk onderzoek (steekproef) is er dus een datareeks per variabele.
Welke zijn de 2 meetniviueaus voor continue variabelen?
Het intervalmeetniveau en ratiomeetniveau
- Ordening en
- Een vaste afstand tussen twee waarden. Aangezien er een verschil in zit dat telkens even groot is, hebben deze variabelen kwantitatieve waarden.
Intervalmeetniveau heeft geen nulpunt Als de waarde gelijk is aan 0, is er dan nog iets aanwezig? Zo ja, dan is het interval.
Enkele voorbeelden van intervalvariabelen zijn:
- Jaartelling
Dit jaar is 2019. Wanneer is de tijd begonnen? Het jaar 0? Neen, want ervoor was er ook al ‘tijd’: middeleeuwen, het ontstaan van de aarde, etc. De jaartelling heeft geen vast nulpunt. - IQ
Bij IQ is er ook geen nulpunt. We geven dit een toewijzing van een nummer, maar 0 IQ is geen vast nulpunt. Het betekent niet dat er een volledige afwezigheid is van intelligentie. - Temperatuur
Bij temperatuur is er vreemd genoeg ook geen nulpunt. Je zou denken dat 0°C het nulpunt is, maar er is nog steeds temperatuur bij 0°C. Bij Fahrenheit gebruiken we zelfs een andere meting. Hun ‘nulpunt’ ligt op een andere plaats, 32°C = 0°F. Bij deze voorbeelden is er geen verhouding. Als het buiten 30 °C is, is het niet twee keer zo warm als bij 15 °C.
VB welk meetniveau gebruik je voor tevredenheid met cijfers. Bijvoorbeeld: Hoe tevreden ben je op een schaal van 1 tot 5? Ook al zou je denken dat het meetniveau interval is, is dat niet zo. De cijfers zijn toewijzingen voor tevredenheid. Er is geen vaste afstand tussen elk puntje van tevredenheid.
Ratiomeetniveau
Dit is het hoogste meetniveau. Het verschil met het intervalmeetniveau is dat er hier een natuurlijk nulpunt aanwezig is.
Enkele voorbeelden van interval variabelen zijn:
- Gewicht
Bij 0 kg is er geen gewicht. Het is een duidelijk nulpunt. - Prijs
Kost iets €0? Dan is het gratis, er is geen prijs.
Welke visualisaties van verdelingsvormen zijn er?
Density plots
Histogrammen
Q-Q plots
Box plots
Welke soorten validiteit zijn er?
Validiteit of geldigheid is de mate waarin een meetinstrument meet of voorspelt wat het beoogt te meten.
De 2 benaderingen om te bepalen of een meetinstrument valide is:
Causale opvatting van validiteit: de test is valide om een bepaald construct te meten als het construct bestaat EN de verschillen tussen mensen op het construct tot verschillende uitkomsten op het meetinstrument leiden. Dus je kan pas nagaan of een meetinstrument valide is als je weet hoe het meetinstrument werkt (de processen kent) = onderzoeken welke processen verklaren hoe verschillen in het construct leiden tot verschillen in de testscores (daarom wordt vaak teruggevallen op constructvaliditeit). Zowel voor meetinstrumenten (bvb thermometer) als voor psychologische meetinstrumenten. Psychologisch= welke processen spelen allemaal een rol bij het tot stand komen van een reactie.
Constructvaliditeit: in hoeverre worden interpretaties van testscores ondersteund door theorie en empirisch bewijs voor het gebruikt van deze test / meetinstrument. De empirische evidentie voor constructvalidering is gebaseerd op de mate van samenhang tss variabelen en /of items
Face validity (indruksvaliditeit) is een van de meest basis maatstaven van validity - geldigheid. Researchers nemen de geldigheid van een procedure aan face validity wanneer het meetinstument de indruk geeft de variabele te meten die het verondersteld wordt te meten. Vb: een test die bepaalt of iemand introvert is of niet heeft indruksvaliditeit als het een maatstaf is voor persoonlijkheid maar duimlengte heeft dit niet.
Criteriumvaliditeit (criterion validity): Hierbij wordt de samenhang /corelatie tussen twee testresultaten bekeken: namelijk jouw eigen meting en een andere meting van de eigenschap die we proberen te meten of te voorspellen (het criterium) = de mate waarin de uitkomsten van een meetinstrument als verwacht samenhangen met die op een ander meetinstrument.
Externe validiteit: de mate waarin de uitkomsten van een studie gegeneraliseerd kunnen worden naar de doelpopulatie
Inhoudsvaliditeit: de mate waarin te items van het meetinstrument het gehele construct omvatten = de mate waarin de aspecten van het te meten begrip volledig worden gemeten met je meetinstrument.
Welke schattingsmethoden gebruikt, Statistische software om de waarden voor de 2 regressie coefficienten te berekenen?
Statistische software gebruikt schattingsmethoden om de waarden voor B0 en B1 (de 2 regressie coefficienten) te berekenen.
➢ De 2 meest gebruikte methoden zijn ordinary least squares en maximum likelihood
Hierbij geldt weer: de waarden komen uit een steekproef en puntschattingen zijn weinig informatief. Als we iets willen zeggen over de populatiewaarde, moeten we kijken naar betrouwbaarheids intervallen.
Welke centrummaten zijn ook bruikbaar bij categorische variabelen?
Bruikbare centrummaten:
➢ Modus → kan bepaald worden bij ordinale en nominale variabelen
➢ Mediaan → kan ook bij ordinale meetwaarden bepaald worden.
Welke 2 factoren zijn samen indicatief voor de kwaliteit van een operationalisatie in een gegeven steekproef?
Betrouwbaarheid en validiteit van de operationalisatie (zowel van een meetinstrument als van een manipulatie) in een gegeven steekproef!
Gegeven steekproef is belangrijk omdat een meetintstument dat in de ene populatie heel valide is kan in een andere steekproef niet valide zijn.
Dus betrouwbaarheid en validiteit zijn geen kenmerken van de operationalisatie zelf en zijn afhankelijk van de populatie / steekproef.
Nominale en ordinale variabelen ?
- Nominaal: de data kunnen alleen worden gecategoriseerd (categorieen benoemd vb haarkleur (geen rangorde = laag meetniveau).
- Ordinaal: De data kunnen worden gecategoriseerd en gerangschikt maar de afstand tss geordende categorieen is onbekend. Bvb opleidingsniveau = = categorische of discrete variabele
Wat zijn meetwaarden van een operationalisatie?
De meetwaarden van een operationalisatie zijn de mogelijke waarden die behaald kunnen worden bij een operationalisatie. Vb je meet iets op een 7-puntenschaal dan zijn 1 tot en met 7 de meetwaarden.
Manipulatie?
Manipulatie =
Als 2 equivalente groepen een andere behandeling krijgen. Deze manipulatie Is de operationalisatie van de variabele waarvan de onderzoeker de invloed wil onderzoeken. vb medicijn en placebo slikken.
Een manipulatie is dus een operationalisatie van een variabele, die bestaat uit een serie verschillende procedures waaraan de verschillende groepen worden blootgesteld.
CRUCIAAL: het enige verschil tss groepen bestaat uit de variabele die onderzocht wordt. Anders is het niet mogelijk conclusies te trekken over de invloed van deze variabele.
Gelijkenissen tussen een meetmodel en een structureel / conceptueel model?
- In beiden is de conventie om de variabelen die rechtstreeks gemeten of gemanipuleerd worden (indicatoren) voor te stellen met rechthoeken en de onderliggende variabelen met ovalen.
- In beiden geven de pijltjes de richting van het verband aan.
Aannames van regressie-analyse?
Enkelvoudige regressie-analyse heeft 5 aannames. 4 zijn harde aannames → als zij worden geschonden, is het regressie-model het verkeerde model. Schending van de laatste aanname maken het model minder efficiënt.
Naarmate harde aannames meer worden geschonden, neemt de zuiverheid van de schattingen van de regressiecoëfficiënten en proportie verklaarde variantie af. naarmate de zachte aannames meer worden geschonden, neemt de accuraatheid van de schattingen van de regressiecoëfficiënten en de proportie verklaarde variantie af.
- Continu meetniveau Beide variabelen moeten een continu meetniveau hebben (interval of ratio). Als 1 van de 2 een categorisch meetniveau heeft, kan beter een variantieanalyse worden toegepast.
- Lineariteit Het verband tussen de 2 variabelen moet lineair zijn. Dat betekent dat de toe- of afname van de ene variabele voor elke waarde van de andere variabele hetzelfde moet zijn. Of een verband lineair is, wordt meestal bepaald op basis van een patroon in de scatterplot
- Onafhankelijkheid Alle observaties moeten onafhankelijk zijn. Dat wil zeggen: alle onderzoekseenheden moeten onafhankelijk zijn. Of datapunten onafhankelijk zijn, ligt besloten in het studieontwerp en de wervingsstrategie voor deelnemers.
- Normaliteit Voor elke waarde van de voorspeller moet de afhankelijke variabele normaal zijn verdeeld. Dit is nodig door het algoritme dat in regressie-analyse wordt gebruikt om de best passende lijn te bepalen. Als de ruis in de afhankelijke variabele niet gemiddeld 0 is, klopt dat algoritme niet.
-
Homoscedasticiteit Dit betekent homogeniteit (gelijkheid) van varianties en representeert de aanname dat de variantie in de afhankelijke variabele gelijk is voor elke waarde van de onafhankelijke variabele. Als deze zachte aanname wordt geschonden zijn de regressiecoëfficiënten geen efficiënte schatters meer. Is er sprake van homoschedasticiteit?
a. Bestuderen scatterplot → als de punten niet overal even ver van de regressielijn af liggen, bijvoorbeeld in een trechtervorm, is er niet sprake van homoscedasticiteit.
b. Toetsen voor homoscedasticiteit.
Wat zijn de 3 Voorwaarden voor een causaal verband tss 2 variabelen?
- De variabele die de invloed uitoefent (causale antecendent) moet eerder in de tijd gemeten of gemanipuleerd worden dan de andere variabele (causale consequent).
- Dit doe je door de causale consequent als laatste te meten
- De variabelen moeten samenhangen.
- Te onderzoeken met een statistische toets.
- Het verband kan niet verklaard worden door andere variabelen of externe invloeden. (confounders). Deze andere variabelen worden ook derde variabelen genoemd. Deze derde variabelen en externe invloeden noemen confounders.
- Trachten deze externe invloeden en derde variabelen in kaart te brengen maar allemaal is onmogelijk.
Continue variabelen?
Continue variabelen zijn kwantitatief = numeriek en zijn meetbaar op een ononderbroken schaal. Ze kunnen in de populatie oneindig aantal waarden aannemen.
2 meetniveaus binnen continue variabelen
- Intervalniveau: de data kunnen worden gecategoriseerd en gerangschikt en er zijn gelijke intervallen tussen de categorieën.
- Rationiveau: de data kunnen worden gecategoriseerd en gerangschikt, de intervallen zijn gelijk, en er is een absoluut of betekenisvol nulpunt.
Beschrijvingsmaten?
-
Centrummaten:
- Gemiddelde
- Mediaan
- Modus
-
Spreidingsmaten
- Range
- Interkwartielafstand (IQR min de mediaan)
- Std Deviatie (std afwijking)
- SS - Sum of Squares : Variatie
- MS - Mean Squares = Variantie
-
Verdelingsmaten
- Modaliteit = toppigheid gemeten met Hartigans dip test = de verdelingsmaat
- Scheefheid = links- , rechtsscheef (asym) of symmetrisch: maat is scheefheid /skewness
- Spitsheid = maat is kurtosis (normaalverdeling kurtosis nul)
Wat zijn 3 valkuilen / aandachtspunten bij Correlatie?
- De interpretatie van hoe sterk variabelen is per definitie een subjectieve aangelegenheid. Vb Als het verband tussen paracetamol en dodelijke bijwerking heel klein is, zou dit
toch cruciaal zijn omdat paracetamol zoveel wordt gebruikt. - Correlatie zegt niets over de vraag of het verband tussen variabelen causaal is.
- Correlaties zijn altijd puntschattingen die worden berekend op basis van steekproeven. Ze verschillen daarom van steekproef tot steekproef. Zonder betrouwbaarheidsinterval kun je onmogelijk iets zeggen over de populatie.