Statistik Flashcards
(43 cards)
Hvad karakteriserer et bakkeformet histogram?
Observationer er koncentreret omrking middelværdien, og koncentrationen aftager væk fra den
Hvad er forskellen mellem diskrete og kontinuerte stokastiske variable?
Diskrete stokastiske variable: Kan kun antage bestemte værdier (f.eks. antal).
Kontinuerte stokastiske variable: Kan antage enhver værdi inden for et interval (f.eks. vægt, højde).
Hvad er en stokastisk variabel?
En variabel, der kan antage forskellige værdier med bestemte sandsynligheder.
Hvad er standardafvigelsen et mål for i et datasæt?
Datas spredning omkring middelværdien
I en normalfordeling, hvor stor en procentdel af data ligger inden for to standardafvigelser fra middelværdien?
95%
Hvad bruges et QQ-plot typisk til?
At afgøre, om data følger en bestemt fordeling, fx normalfordeling
Hvad er binominalfordelingsformlen?
P(X=k)=(n,k)p^k(1−p)^n−k
Hvad står n, k og p for i binominalfordelingsformlen?
EKS med tal
n=5 (antal forsøg)
k=1 (antal succeser)
p=0,2 (sandsynligheden for succes)
Hvad betyder det, når p-værdien i en hypotesetest er meget lille?
Hvis p-værdien er meget lille, betyder det, at der er stærk evidens imod nulhypotesen, og vi forkaster den typisk. Det indikerer, at de observerede data er usandsynlige under nulhypotesen.
Hvad er formålet med en tæthedsfunktion?
En tæthedsfunktion viser, hvordan data er fordelt over et kontinuert interval, og arealet under kurven repræsenterer sandsynligheden.
Hvad er en vigtig egenskab ved en tæthedsfunktion for kontinuerte variable?
Arealet under kurven er altid lig med 1
Korrekt
Hvad er middelværdien, medianen og modus for en perfekt normalfordeling?
I en perfekt normalfordeling er middelværdien, medianen og modus alle lig med hinanden.
I en normalfordeling, hvad er sandsynligheden for at finde en observation, der ligger mere end tre standardafvigelser fra middelværdien?
0,3, da tre standardafvigelser fra middelværdien er 99,7
Hvilket af følgende kan bruges til at bestemme, om nulhypotesen skal forkastes?
A) T-test
B) Histogram
C) Dataens median
D) Scatterplot
T-test
Hvad repræsenterer punkterne i et QQ-plot?
De forventede værdier, hvis data følger en bestemt fordeling
Hvilket resultat i et QQ-plot indikerer, at dataene følger en normalfordeling?
Punkterne danner en lige linje
Hvad er en sumkurve?
En kurve, der viser den kumulative frekvens af observationer
Hvordan kan sumkurven anvendes til at finde sandsynligheden for et interval i et datasæt?
Ved at se på forskellen mellem de kumulative frekvenser ved intervallets øvre og nedre grænser.
Hvilket af følgende udsagn er korrekt om sumkurven?
A) Den kan kun anvendes til diskrete datasæt
B) Den viser altid en nedadgående tendens
C) Arealet under sumkurven er altid lig med 1
D) Den viser den kumulative frekvens og vokser altid
D) Den viser den kumulative frekvens og vokser altid
Hvad beskriver et konfidensinterval?
Et interval, der indeholder den sande populationsparameter med en bestemt sandsynlighed
Hvilken faktor påvirker størrelsen af et konfidensinterval?
Antallet af observationer i stikprøven og standardafvigelsen i populationen påvirker størrelsen af konfidensintervallet. Større stikprøve og mindre standardafvigelse vil føre til et smallere konfidensinterval.
Hvad betyder et 95% konfidensinterval?
At der er 95% sandsynlighed for, at intervallet indeholder den sande parameter (Et 95% konfidensinterval betyder, at hvis vi gentager eksperimentet mange gange, vil 95% af de konstruerede intervaler indeholde den sande populationsparameter.)
Hvad repræsenterer binomialkoefficienten (n,k)?
Antallet af måder at vælge k succeser i n forsøg
Hvordan beregnes binomialkoefficienten?
n!/k!(n-k)!