Hoofdstuk 2: Beschrijvende Statistiek Flashcards
(44 cards)
Absolute frequentie
Nj
Aantal uitkomsten xi in de steekproef telling die gelijk zijn aan mj
Relatieve frequentie
Fj,n
= steekproefproporties
Nj/n
Staafdiagram
Mogelijke uitkomsten = horizontale as
Fj,n of nj = verticale as
De balken raken elkaar niet aan
‘Hoe waarschijnlijk de overeenkomstige uitkomst I’d binnen de genomen steekproef
Opp. Heeft geen betekenis!
Taartdiagram
Fj,n van uitkomsten steekproef bepaalt hoe de taart wordt verdeeld
Kwantitatieve/eindig aantal gegevens
Discretisatie/groepering van gegevens
Oplossing voor continue/discrete variabelen met oneindig aantal elementen
Indeling per klasse: klassenbreedte Δ
Mj = klassenmiddens
Histogram
Horizontale as: klassenbreedte Δ
Verticale as: af nj of rd nj/n of frequentiedichtheid hj =fj,n/Δj = nj/Δjn
Tot. Opp = 1
Symmetrische verdeling
Gedragen zich op dezelfde wijze aan de linkse en rechts zijde van de figuur.
Normale verdeling
Klokcurve
Hoe groter steekproef hoe duidelijker normaal verdeling
Scheve (niet-symmetrische verdeling)
A zijde zwakt meer af dan de andere.
bimodale verdeling
Duidelijk twee doelgroepen te zien in histogram, 2 toppen (modi).
uitschieter?
getal dat te klein of te groot is, en dus niet bij de overgrote meerderheid van de getallen past.
cumulatieve verdelingsfunctie
alternatief voor frequentietabellen
uitkomsten van het experiment die kleiner zijn dan of gelijk zijn aan x.
trap grafiek, waar treden niet geconnecteerd zijn!
empirische verdelingsfunctie
functie wordt berekend op basis van een steekproef
kwantiel functie
Qn
gegeven een bepaald percentage 0<p<1, welk reëel getal x situeert zich dan in de overeenkomstige positie in de steekproef?
inverse functie van de cumulatieve verdelingsfunctie
Q1, Q2, Q3?
Qn(O,25), Qn(0,50), Qn(O,75)
steekproefgemiddelde
x (met streep)
erg gevoelig voor uitschieters
niet nominaal en ordinaal
mediaan
alternateif gemiddelde
middelste waarde van geordende steekproef.
niet nominaal
modus
element uit de uitkomstenverzameling dat het meest voorkomt in de steekproef, hoogste frequentie
wel nominaal
bereik
spreidingsmaat
afstand tussen grootste x(n) en kleinste waarneming x(1): R=X(n)-X(1)
te weinig info
standaardafwijking/steekproefstanddaarddeviatie
maat voor de spreiding van een variabele of van een verdeling of populatie. de wortel uit de variantie
variantie
Hoe groter de variantie, hoe meer de afzonderlijke waarden onderling verschillen, en dus ook hoe meer de waarden van het “gemiddelde” afwijken
normale verdeling, regel 2/3
2/3 van de gegevens ligt binnen een afstand van 1 standaarddeviatie aan weerszijden van het steekproefgemiddelde
normale verdeling, 95 %
95% van de gegevens ligt binnen een afstand van 2 standaarddeviaties aan weerszijden van het steekproefgemiddelde.
interkwartielafstand IQR
geeft lengte van gebied rond de mediaan dat +- 1/2 van gegevens bevat.
minder gevoelig voor uitschieters
Qn(0,75)-Qn(0,25)