Lecture 4 (Reliability, Testing pt. 1) Flashcards
(19 cards)
Als de centrale limietstelling niet op gaat, kun je de standaard normale verdeling niet gebruiken. Welke verdelingen kun je wel gebruiken wegens hun robuustheid?
De (Student’s) T distributie, de Chi-kwadraat distributie, de binominale (B) distributie
De hypothesetoets voor steekproefgemiddelden en regressiecoefficienten
De t-toets
De hypothesetoets (significantietoets)
Deze gebruik je om te testen of er voldoende bewijs is tegen de nul hypothese
Kenmerken van de Student’s T distributie
- Laat de steekproevenverdeling van het steekproefgemiddelde zien
- Verschilt per steekproefgrootte (df, familie van distributies)
- Dikkere staarten en meer spreiding dan de standaard normale verdeling (daarom sd >1)
- Populatie standaarddeviatie is onbekend
- Hoe groter het aantal vrijheidsgraden (df), hoe meer de t-distributie op de standaard normale distributie zal lijken
- Gebruikt voor de t-toets en testen van regressiecoefficienten
De hypothesetoets voor steekproefproporties
De Z-toets
Binominale toets
Hypothesetoets voor het testen van proporties met kleine steekproefgrootte (gezien de z-toets daarvoor niet geschikt is als de CLT niet op gaat)
Binominale distributie
Wanneer elk resultaat succes of mislukking is (binary/binominaal), met steeds dezelfde kans op succes (bijvoorbeeld kop of munt gooien, of wel of niet winnen)
2 Factoren waar de breedte van een intervalschatting vanaf hangt:
- De standaarddeviatie van de steekproef
- De steekproefomvang
4 Stappen om een betrouwbaarheidsinterval te berekenen voor de populatieproportie
- Bereken de puntschatter (deel/geheel)
- Bepaal de Z-score bij het betrouwbaarheidsniveau
- Bereken de standaardfout (se)
- Vul de formule voor het BI in
Significantieniveau (α)
Geeft de kans aan (vaak 5%) die je bereid bent om te nemen waarin je de nul hypothese onterecht verwerpt (Type-I fout)
Betrouwbaarheidsniveau
De waarschijnlijkheid (meestal 95%) dat de steekproef een juiste afspiegeling is van de populatie.
Interpretatie van het betrouwbaarheidsinterval (BI)
Bij een betrouwbaarheidsniveau van 95%, zou ongeveer 95% van de berekende intervallen de werkelijke populatieparameter bevatten
Z-score 95% BI
1.96
Z-score 99% BI
2.58
Z-score 90% BI
1.65
4 Vaste interpretaties van het betrouwbaarheidsinterval
- Populatieparameter is onbekend, maar ligt vast
- Steekproef geeft een puntschatter (proportie of gemiddelde) met bijbehorend betrouwbaarheidsinterval
- 95% van de steekproeven heeft een BI wat daadwerkelijk de populatieparameter bevat
4 Stappen om een betrouwbaarheidsinterval te berekenen voor het populatiegemiddelde
- Bereken de puntschatter (ȳ)
- Bepaal de t-score middels het BI en de df
- Bereken de standaardfout (se)
- Vul de formule voor BI in
5 Stappen van een hypothesetoets
- Definieer aannames
- Stel hypothesen op (H0, Ha)
- Bereken toetsingsgrootheid (Z, t, X^2)
- Bepaal p waarde of kritieke waarde
- Trek conclusie
2 Manieren om een hypothese (H0) te toetsen op basis van de puntschatter
- Het betrouwbaarheidsinterval (wanneer H0 in het verwerpingsgebied valt, verwerp H0)
- Hypothesetoets (als de kans op het observeren van de puntschatter, of extremer, gegeven H0 is waar, kleiner is dan 5% verwerp je H0 - het effect is dan namelijk niet waarschijnlijk onder H0)