{ "@context": "https://schema.org", "@type": "Organization", "name": "Brainscape", "url": "https://www.brainscape.com/", "logo": "https://www.brainscape.com/pks/images/cms/public-views/shared/Brainscape-logo-c4e172b280b4616f7fda.svg", "sameAs": [ "https://www.facebook.com/Brainscape", "https://x.com/brainscape", "https://www.linkedin.com/company/brainscape", "https://www.instagram.com/brainscape/", "https://www.tiktok.com/@brainscapeu", "https://www.pinterest.com/brainscape/", "https://www.youtube.com/@BrainscapeNY" ], "contactPoint": { "@type": "ContactPoint", "telephone": "(929) 334-4005", "contactType": "customer service", "availableLanguage": ["English"] }, "founder": { "@type": "Person", "name": "Andrew Cohen" }, "description": "Brainscape’s spaced repetition system is proven to DOUBLE learning results! Find, make, and study flashcards online or in our mobile app. Serious learners only.", "address": { "@type": "PostalAddress", "streetAddress": "159 W 25th St, Ste 517", "addressLocality": "New York", "addressRegion": "NY", "postalCode": "10001", "addressCountry": "USA" } }

BA & Statistik Flashcards

(44 cards)

1
Q

Hvad er et konfidensinterval, og hvad bruges det til?

A

Et konfidensinterval er et interval beregnet ud fra en stikprøve, som med en vis statistisk sikkerhed (fx 95%) forventes at indeholde den sande populationsparameter, typisk middelværdien.
Det bruges til at udtale sig om populationen baseret på et stikprøveestimat og tager højde for usikkerheden i data.
Det gør det muligt at sige fx:

“Vi kan med 95% statistisk konfidens sige, at gennemsnittet ligger mellem 494 og 500.”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad er standardfejl (SE), og hvordan beregnes den?

A

Standardfejlen er et mål for, hvor præcist stikprøvegennemsnittet estimerer populationsgennemsnittet. Jo mindre SE, jo mere præcis er vores stikprøve.
Formel:

SE = s/√n

Standardfejl (SE) er et mål for usikkerheden i et estimat, typisk et stikprøvegennemsnit. Det fortæller, hvor meget man kan forvente, at stikprøvegennemsnittet varierer fra stikprøve til stikprøve, hvis man gentager forsøget mange gange.

“Standardfejlen angiver, hvor meget et stikprøvegennemsnit kan forventes at variere, hvis man gentog forsøget. Den beregnes som standardafvigelsen divideret med kvadratroden af stikprøvestørrelsen og bruges til at lave konfidensintervaller og hypotesetest.”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvordan beregnes et konfidensinterval trin for trin?

A
  1. Find stikprøvegennemsnittet (xhat)
  2. Beregn standardfejlen (SE)
  3. Find den relevante z- eller t-værdi afhængig af konfidensniveau og stikprøvestørrelse
  4. Fejlmargin=kritiskværdi×SE
  5. Konfidensinterval = xhat +- Fejlmargin
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvad betyder det, at konfidensintervallet er [494 ; 500] med 95% sikkerhed?

A

Det betyder, at hvis vi gentog forsøget mange gange, ville 95% af de beregnede intervaller indeholde den sande middelværdi.
Det betyder ikke, at der er 95% sandsynlighed for, at den sande middelværdi ligger i netop dette ene interval — den er enten i intervallet eller ikke.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad er forskellen på at bruge z-fordeling og t-fordeling i konfidensintervaller?

A

Z-fordeling bruges, når populationsstandardafvigelsen er kendt, eller stikprøven er stor (typisk n > 30).

T-fordeling bruges, når populationsstandardafvigelsen er ukendt, og stikprøven er lille (typisk n ≤ 30).
T-fordelingen har tykkere haler for at kompensere for større usikkerhed.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvordan påvirkes konfidensintervallets bredde af stikprøvestørrelsen?

A

Jo større stikprøve, desto mindre standardfejl, og dermed smallere konfidensinterval.
En stor stikprøve giver altså et mere præcist estimat af populationsgennemsnittet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvordan påvirker valg af konfidensniveau (f.eks. 90%, 95%, 99%) konfidensintervallet?

A

Et højere konfidensniveau (f.eks. 99%) kræver en større kritisk værdi (z eller t), hvilket betyder et bredere interval – altså mere sikkerhed, men mindre præcision.
Et lavere niveau (f.eks. 90%) giver et smallere interval, men mindre sikkerhed.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvad kan man sige – og ikke sige – med et konfidensinterval?

A

Man kan sige:

“Med 95% statistisk sikkerhed ligger populationsgennemsnittet mellem X og Y.”

Man kan ikke sige:

“Der er 95% chance for, at gennemsnittet ligger her.”

Det er en vigtig teoretisk sondring — og en typisk eksamensfælde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvordan hænger konfidensintervaller og usikkerhed sammen?

A

Et konfidensinterval viser, hvor stor usikkerhed der er omkring stikprøvegennemsnittet som estimat for populationsgennemsnittet.
Jo bredere interval, desto større usikkerhed.
Intervallet er udtryk for et sandsynlighedsbånd omkring gennemsnittet, hvor man med en vis statistisk sikkerhed forventer, at den sande værdi ligger.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvorfor er det forkert at sige “Vi er 95% sikre på, at gennemsnittet er X”?

A

Fordi den sande værdi er fast – det er intervallet, der varierer fra stikprøve til stikprøve.
Det korrekte er at sige:

“Vi kan med 95% statistisk sikkerhed sige, at intervallet indeholder den sande middelværdi.”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvad er forskellen på et 90% og et 95% konfidensinterval?

A

Et 95% interval giver mere sikkerhed, men er bredere end et 90% interval.

90% konfidens → smallere interval → større risiko for at tage fejl

95% konfidens → bredere interval → lavere risiko for fejl
Derfor vælger man ofte 95% som kompromis mellem præcision og sikkerhed.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvorfor giver små stikprøver større usikkerhed i konfidensintervallet?

A

Fordi standardfejlen bliver større ved lav n (SE = s / √n), og det giver et bredere konfidensinterval.
Derudover bruger man t-fordelingen ved små n, som har bredere haler end z-fordelingen og dermed øger fejlmarginen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvornår giver det mening at bruge konfidensinterval i praksis?

A

Når man ønsker at:

Estimere en ukendt populationsparameter (fx gennemsnit eller andel)

Vise graden af usikkerhed i et stikprøveresultat

Kommunikere, hvad man kan sige med sikkerhed, og hvad man ikke kan

Eksempel: “Vi vurderer, at den gennemsnitlige studietid ligger mellem 2,4 og 3,0 timer pr. uge med 95% konfidens.”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvordan bruger man et konfidensinterval aktivt i en analyse?

A
  1. Vurdere præcision og usikkerhed
    → Smalle intervaller = præcise estimater
    → Brede intervaller = stor usikkerhed
  2. Tjekke statistisk signifikans
    → Indeholder intervallet ikke 0? → Signifikant effekt
    → Indeholder det 0? → Ingen signifikant effekt
  3. Sammenligne grupper
    → Overlapper intervallerne? → Ingen klar forskel
    → Overlapper de ikke? → Mulig signifikant forskel
  4. Understøtte beslutninger
    → Intervallet viser et sandsynligt spænd – fx for NPS eller effektstørrelse
    → Hjælper med at vælge den mest robuste løsning
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvad betyder det, hvis to konfidensintervaller overlapper?

A

Det tyder på, at der ikke nødvendigvis er en signifikant forskel mellem de to grupper.
Men overlap alene er ikke nok til at konkludere — det kræver en egentlig hypotesetest for at være sikker.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvordan påvirker outliers et konfidensinterval?

A

Outliers kan øge standardafvigelsen (s) og dermed gøre intervallet bredere.
Det betyder større usikkerhed og mindre præcision i estimatet.
Derfor er det vigtigt at tjekke datakvaliteten og overveje at fjerne ekstreme værdier, hvis de ikke er meningsfulde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Hvad er formålet med en hypotesetest?

A

Formålet med en hypotesetest er at vurdere, om en antagelse om en populationsparameter kan forkastes på baggrund af en stikprøve.
Det bruges, når vi vil teste, om der er en statistisk signifikant forskel mellem fx to gennemsnit, en gennemsnitsværdi og en hypotetisk værdi, eller to andele.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Hvad er en nulhypotese (H₀)?

A

Nulhypotesen er en antagelse om, at der ikke er nogen effekt, forskel eller ændring.
Det er den hypotese, vi forsøger at afvise.
Eksempel: “Gennemsnittet er 4 timer” eller “Der er ingen forskel i kundetilfredshed”.

19
Q

Hvad er en alternativ hypotese (Hₐ)?

A

Den alternative hypotese er det, vi tror, der måske er sandt i stedet for H₀.
Det er den hypotese, vi vil acceptere, hvis vi kan forkaste H₀.
Eksempel: “Gennemsnittet er mindre end 4 timer” eller “Der er en forskel”.

20
Q

Hvordan fungerer p-værdien i en hypotesetest?

A

P-værdien er sandsynligheden for at observere et resultat, der er mindst lige så ekstremt som det, vi har fundet, hvis H₀ er sand.
En lav p-værdi (typisk < 0,05) betyder, at det er usandsynligt, at resultatet skyldes tilfældigheder, og vi forkaster H₀.

21
Q

Hvad er signifikansniveauet (α), og hvad bruges det til?

A

Signifikansniveauet (α) er den grænse, du på forhånd fastsætter for, hvor stor en risiko du er villig til at acceptere for at begå en type 1-fejl
(dvs. at du forkaster nulhypotesen H₀, selvom den er sand).

22
Q

Hvad er en teststørrelse (z eller t-værdi)?

A

Det er en værdi, der beregnes ud fra stikprøvedata og sammenlignes med en teoretisk grænseværdi fra z- eller t-fordelingen.
Den måler hvor mange standardfejl, vi er fra den hypotetiske middelværdi.
Jo større den absolutte værdi, desto stærkere evidens imod H₀.
“En teststørrelse – z- eller t-værdi – måler, hvor langt et stikprøvegennemsnit ligger fra nulhypotesens værdi målt i standardfejl. Den bruges til at vurdere, om afvigelsen er stor nok til at være statistisk signifikant.”

23
Q

Hvornår bruges en ensidet vs. tosidet hypotesetest?

A

Ensided test bruges, når vi kun er interesseret i ændringer i én retning (fx “gennemsnittet er faldet”).

Tosidet test bruges, når vi er åbne for ændringer i begge retninger (fx “gennemsnittet er forskelligt”).
Tosidet test er mere konservativ og kræver stærkere evidens.

24
Q

Hvad er forskellen på deskriptiv og inferentiel statistik i hypotesetest?

A

Deskriptiv statistik beskriver stikprøven (fx gennemsnit = 2,7).

Inferentiel statistik (hypotesetest) vurderer, om resultatet kan generaliseres til populationen med statistisk sikkerhed.

25
Hvad betyder det, hvis vi ikke forkaster H₀?
Det betyder ikke, at H₀ er sand — blot at vi ikke har tilstrækkelig evidens til at afvise den. Vi accepterer ikke H₀ – vi undlader at forkaste den. Riskerer at begå en type 2 fejl
26
Hvad er en Type I-fejl i en hypotesetest?
En Type I-fejl opstår, når vi forkaster H₀, selvom den i virkeligheden er sand. Det betyder, at vi tror, der er en effekt eller forskel, selvom der ikke er det. Eksempel: Vi tror, NPS er faldet → igangsætter unødvendige tiltag → spilder ressourcer. Risikoen for denne fejl er lig med signifikansniveauet α (typisk 5%).
27
Hvad er en Type II-fejl i en hypotesetest?
En Type II-fejl sker, når vi ikke forkaster H₀, selvom den i virkeligheden er falsk. Vi overser en reel forskel eller ændring. Eksempel: Vi tror, NPS er uændret, selvom den reelt er faldet → mister kunder over tid. Risikoen for denne fejl betegnes β.
28
Hvad viser en beslutningsmatrix i hypotesetest?
Beslutningsmatrixen viser de fire mulige udfald, når vi laver en hypotesetest. Den kombinerer to ting: Virkeligheden – om nulhypotesen (H₀) faktisk er sand eller falsk Vores beslutning – om vi vælger at forkaste eller ikke forkaste H₀ De fire udfald: ✅Vi forkaster ikke H₀, og H₀ er sand → Dette er en korrekt beslutning. Vi fastholder, at der ikke er en effekt, og det passer med virkeligheden. ❌ Vi forkaster H₀, selvom H₀ er sand → Dette er en Type I-fejl. Vi tror, der er en effekt eller forskel, selvom der ikke er det i virkeligheden. Risikoen for at begå denne fejl er α (signifikansniveauet, fx 5%). ❌ Vi forkaster ikke H₀, selvom H₀ er falsk → Dette er en Type II-fejl. Vi overser en reel forskel eller effekt. Risikoen for dette kaldes β. ✅ Vi forkaster H₀, og H₀ er faktisk falsk → Dette er den anden korrekte beslutning. Vi opdager korrekt, at der er en effekt.
29
Hvad er regressionsanalyse?
Regressionsanalyse er en statistisk metode, der bruges til at undersøge sammenhængen mellem en afhængig variabel og en eller flere forklarende variable. Den bruges til at lave forudsigelser og analysere, hvilke faktorer der påvirker en bestemt størrelse.
30
Hvad er forskellen på afhængig og forklarende variabel?
Den afhængige variabel (Y) er det, vi ønsker at forklare eller forudsige (f.eks. prisen på en bil). De forklarende variable (X) er de faktorer, vi tror påvirker Y (f.eks. alder, kilometerstand, brændstoftype).
31
Hvad viser hældningen (koefficienten) i en regressionsmodel?
Koefficienten viser, hvor meget Y ændres, når X ændres med én enhed, hvis alt andet holdes konstant. F.eks. “For hvert år bilen bliver ældre, falder prisen med 14.025 kr.”
32
Hvad er forklaringsgraden (R²)?
R² viser hvor stor en del af variationen i den afhængige variabel, der kan forklares af modellen. R² = 0,90 → 90% af variationen i pris kan forklares af de valgte variable R² = 0 → modellen forklarer intet Jo højere R², jo bedre passer modellen.
33
Hvad er residualer?
Residualer er forskellen mellem den faktiske værdi og den forudsagte værdi. Man bruger residualer til at vurdere modellens nøjagtighed – små residualer betyder, at modellen rammer godt.
34
Hvad er multikollinearitet, og hvorfor er det et problem?
Multikollinearitet opstår, når forklarende variable er stærkt korrelerede med hinanden. Det skaber problemer, fordi det bliver svært at afgøre, hvilken variabel der reelt har betydning. Hvis korrelationen mellem to forklarende variable er over 0,8 → overvej at fjerne én af dem.
35
Hvordan kan man inkludere Ja/Nej-variable i regressionsanalyse?
Man bruger boolean variabler (0/1). F.eks.: “Veteranbil?” → 1 = Ja, 0 = Nej Det giver mulighed for at teste effekten af kategoriske variable i modellen.
36
Hvad viser konfidensintervaller i en regressionsmodel?
Det viser, med fx 95% konfidens, hvilket interval den sande værdi af en regressionskoefficient ligger i. Hvis intervallet ikke indeholder 0, er effekten statistisk signifikant.
37
Hvornår skal man bruge multipel regression frem for simpel regression?
Simpel regression bruges, når man har én forklarende variabel. Multipel regression bruges, når man har flere forklarende variable, og man ønsker at modellere effekten af dem samlet på den afhængige variabel. Eksempel: Du vil undersøge effekten af reklamebudget vs. salgsniveau --> her vil man bruge simpel.
38
Hvad er significance F i en regressionsanalyse?
"Significance F" er p-værdien for den samlede F-test i en regressionsmodel. Den tester: 🔎 “Er der mindst én af de uafhængige variabler i modellen, der har en signifikant effekt på den afhængige variabel?” 🔬 Baggrunden: I en regressionsanalyse (med flere forklarende variabler) kan du stille følgende nulhypotese: 𝐻 0 H 0 ​ : Alle koefficienter = 0 → ingen forklarende effekt 𝐻 1 H 1 ​ : Mindst én koefficient ≠ 0 → modellen forklarer noget 👉 Hvis: Significance F er < 0,05 → modellen forklarer signifikant variation Significance F er > 0,05 → modellen forklarer ikke signifikant noget
39
Hvad er formlen for Konfidensinterval ved brug af t-værdien?
Konfidensinterval = x̄ ± t_(α/2, df) · (s / √n)
40
Hvad er formlen for konfidensinterval med z-værdi?
Konfidensinterval = x̄ ± z_(α/2) · (σ / √n)
41
Hvornår skal man bruge t-fordeling i stedet for z-fordeling i konfidensintervaller?
Man skal bruge t-fordeling, når populationsstandardafvigelsen (σ) er ukendt, og man i stedet estimerer den med stikprøvens standardafvigelse (s). Det gælder uanset stikprøvestørrelsen. → Ved store stikprøver (n > 30) ligner t-fordelingen z-fordelingen, men det mest korrekte er stadig at bruge t, hvis σ er ukendt.
42
Hvordan beregner man en teststørrelse?
Z-test: z = (x̄ - μ₀) / (σ / √n) T-test t = (x̄ - μ₀) / (s / √n)
43
Hvad er testens styrke?
Testens styrke er sandsynligheden for, at testen korrekt forkaster nulhypotesen (H₀), når den faktisk er falsk.En stærk test = stor sandsynlighed for at afsløre en reel effekt En svag test = stor risiko for at overse en reel effekt (type 2-fejl) Der er ikke én simpel formel, men styrken beregnes som: Styrke = 1 − 𝛽 Styrke=1−β hvor: 𝛽 β = sandsynligheden for type 2-fejl (at beholde H₀, selvom den er falsk)
44