Gamla tentor Flashcards

(13 cards)

1
Q

Om vi antar att antalet bilar som passerar Vasagatan 1 under en timme är Poissonfördelat, vad kan vi säga om tiden mellan två på varandra följande bilar?

A) Normalfördelad
B) Uniformfördelad
C) Exponentialfördelad
D) Binomialfördelad

A

A) Normalfördelad – Fel
En normalfördelning används ofta för att beskriva variabler som är resultatet av många små, oberoende faktorer (t.ex. kroppslängd eller IQ). I detta fall är tiden mellan bilarna inte en summa av flera små faktorer utan en väntetid mellan slumpmässiga händelser, vilket gör att den inte följer en normalfördelning.

B) Uniformfördelad – Fel
En uniformfördelning innebär att alla utfall är lika sannolika inom ett visst intervall. Om tiden mellan bilarna vore uniformfördelad, skulle de alltid komma inom ett visst fast tidsintervall med samma sannolikhet, vilket inte är fallet här. Istället är det mer sannolikt att korta väntetider sker oftare än långa väntetider, vilket stämmer överens med en exponentialfördelning.

C) Exponentialfördelad – ✅ Rätt
Om antalet bilar per tidsenhet är Poissonfördelat, följer tiden mellan två bilar en exponentialfördelning. Detta beror på att en Poissonprocess har minneslöshetsegenskapen, vilket innebär att sannolikheten för nästa händelse är oberoende av när den senaste händelsen inträffade. Detta är en central egenskap hos exponentialfördelningen.

D) Binomialfördelad – Fel
En binomialfördelning beskriver antalet lyckade försök i ett fast antal försök (n) med en viss sannolikhet (p) per försök. Exempelvis kan den användas för att räkna hur många bilar av ett visst bilmärke som passerar, men den används inte för att modellera tiden mellan slumpmässiga händelser.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Rätt svar är B) Fördelningen av data förändras inte, men medelvärdets fördelning blir mer normalfördelad.

A

Påståendet i frågan är falskt eftersom stickprovsstorleken inte påverkar den ursprungliga fördelningen av data. Om populationens data är skev, bimodal eller uniform kommer den fördelningen att vara densamma oavsett hur stort stickprovet är. Däremot händer följande viktiga fenomen:

Centrala gränsvärdessatsen (CLT - Central Limit Theorem)

När stickprovsstorleken ökar blir fördelningen av stickprovsmedelvärdet (inte själva data) mer normalfördelad, oavsett den ursprungliga populationens fördelning.
Detta innebär att om vi tar många stickprov och beräknar deras medelvärden, så kommer dessa medelvärden att vara ungefär normalfördelade när stickprovsstorleken är tillräckligt stor.
Den ursprungliga datafördelningen påverkas inte

Om de ursprungliga data är snedfördelade, multimodala eller uniforma, kommer de att förbli så även vid större stickprovsstorlekar.
Stickprovsstorleken förändrar alltså inte den underliggande fördelningen, endast hur stickprovsmedelvärdet beter sig vid upprepade urval.
Förklaring av de andra svarsalternativen:

A) Data blir mer normalfördelade – Fel
Stickprovsstorleken påverkar inte hur de faktiska observationerna är fördelade. Om populationen är skev eller bimodal kommer stickprovet att reflektera det oavsett storlek.

B) Fördelningen av data förändras inte, men medelvärdets fördelning blir mer normalfördelad – ✅ Rätt
Detta är en direkt konsekvens av den centrala gränsvärdessatsen (CLT).

C) Data blir mer uniformfördelade – Fel
Stickprovsstorleken har ingen sådan effekt på fördelningen av data. Om de var uniformfördelade från början, kommer de att förbli det.

D) Data blir mer skeva – Fel
Stickprovsstorleken gör inte att data blir mer snedfördelade. Däremot kan små stickprov ge skeva resultat genom slumpmässiga variationer, men detta är inte en generell regel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Väntevärdet av en likformigt fördelad slumpvariabel är medelvärdet av den övre och den undre gränsen för värdena som slumpvariabeln kan ta.

Sant eller falskt?

A

Om en slumpvariabel är likformigt fördelad över intervallet [𝑎,𝑏]betyder det att alla värden inom intervallet är lika sannolika.
Då blir väntevärdet (förväntat medelvärde) av slumpvariabeln medelvärdet av den övre och undre gränsen:

E(X) = (a + b) / 2

Detta innebär att vi kan räkna ut väntevärdet genom att ta summan av det minsta och största möjliga värdet och sedan dela på två.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Att man inte kan förkasta nollhypotesen i ett statistiskt test betyder att nollhypotesen är sann.

Sant eller falskt?

A

Svar:
❌ Falskt

Förklaring:
Att vi inte kan förkasta nollhypotesen (𝐻0) betyder inte att den är sann – det betyder bara att vi inte har tillräckligt med bevis för att säga att den är falsk.

Ett statistiskt test testar om vi har tillräckligt starka bevis för att kunna förkasta
𝐻0 till förmån för alternativhypotesen 𝐻1. Om vi inte kan förkasta 𝐻0, kan det bero på att:

  1. Nollhypotesen faktiskt är sann, men vi kan aldrig bevisa det med säkerhet.
  2. Stickprovet är för litet eller har för hög varians för att upptäcka en verklig effekt.
  3. Signifikansnivån (𝛼) är för strikt, vilket gör det svårt att hitta en signifikant skillnad.
    I statistik säger vi ofta:

“Failure to reject 𝐻0 does not mean 𝐻0 is true.”

Vi kan alltså aldrig bevisa att 𝐻0 är sant, bara att vi saknar bevis för att påstå motsatsen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

En exponentialfördelad slumpvariabel tar bara icke-negativa värden.

Sant eller falskt?

A

Svar:
✅ Sant

Förklaring:
En exponentialfördelad slumpvariabel beskriver väntetider mellan slumpmässiga händelser, som exempelvis tiden tills nästa kund anländer eller tiden mellan två bilpassager. Eftersom väntetider inte kan vara negativa, kan en exponentialfördelad variabel bara ta icke-negativa värden.

Vad det innebär:
Det betyder att om en variabel följer en exponentialfördelning kan den aldrig vara negativ – den börjar alltid från 0 och går uppåt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Fråga:
Om man kastar en vanlig sexsidig tärning tillräckligt många gånger kommer medelvärdet av kasten att vara nära 3.5.

Sant eller falskt?

A

Svar:
✅ Sant

Förklaring:
För en vanlig sexsidig tärning är alla utfall
1,2,3,4,5,6 lika sannolika. Väntevärdet (det långsiktiga genomsnittet) av en slumpvariabel är medelvärdet av alla möjliga utfall.

Eftersom tärningen är symmetrisk och alla siffror har samma sannolikhet, kommer medelvärdet av oändligt många kast att närma sig 3.5 enligt lagen om stora tal.

Vad det innebär:
Om du kastar en tärning få gånger, kan medelvärdet variera. Men ju fler kast du gör, desto närmare 3.5 blir medelvärdet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

En binomialfördelad slumpvariabel med parametrarna
och p tar bara heltalsvärden från 0 till och med n.

A

✅ Sant

Förklaring:
En binomialfördelad slumpvariabel beskriver antalet lyckade försök i n oberoende försök, där varje försök har sannolikheten p för att lyckas.

Eftersom varje försök kan resultera i antingen en framgång (1) eller en misslyckande (0), kan det totala antalet framgångar bara vara heltal mellan 0 och n.

Vad det innebär:
Om du exempelvis kastar en mynt 10 gånger och räknar antalet klave, kan du få allt från 0 till 10 klave, men aldrig decimaler eller negativa värden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Om händelserna
𝐴 och 𝐵 är ömsesidigt uteslutande, gäller att sannolikheten för snittet av 𝐴 och 𝐵är negativ.

A

Svar:
❌ Falskt

Förklaring:
Om två händelser
A och B är ömsesidigt uteslutande betyder det att de inte kan inträffa samtidigt. Detta innebär att snittet (gemensamma utfall) mellan A och B är tomt, alltså:

P(A∩B)=0

Sannolikheter kan aldrig vara negativa – de ligger alltid mellan 0 och 1. Eftersom snittet mellan ömsesidigt uteslutande händelser är tomt, är sannolikheten för snittet 0, inte negativ.

Vad det innebär:
Om exempelvis A = “tärningen visar 2” och B = “tärningen visar 5”, kan båda inte inträffa samtidigt, så sannolikheten för att båda händer samtidigt är 0, inte negativ.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Bredden för ett konfidensintervall för medelvärdet i en population med känd varians ökar då stickprovsstorleken ökar.

Sant eller falskt?

A

Svar:
❌ Falskt

Konfidensintervallets bredd beror på stickprovsstorleken variansen (
och konfidensnivån. När stickprovsstorleken ökar, blir uppskattningen av medelvärdet mer precis, vilket leder till att konfidensintervallet blir smalare, inte bredare.

Formeln för ett konfidensintervall för medelvärdet är:

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Typvärdet och medelvärdet är alltid samma oavsett fördelning.

Sant eller falskt?

A

Typvärde (mode) är det mest frekventa värdet i en fördelning, medan medelvärde (mean) är summan av alla värden dividerat med antalet observationer.

Dessa är inte alltid samma, särskilt i fördelningar som är skeva eller multimodala:

Symmetriska fördelningar (t.ex. normalfördelningen) → Typvärde och medelvärde kan vara lika.

Skevfördelade data → Medelvärdet påverkas av extrema värden och kan skilja sig från typvärdet.

Multimodala fördelningar → Kan ha flera typvärden medan medelvärdet är ett enda värde.

Vad det innebär:
Bara i vissa fall (t.ex. en perfekt symmetrisk normalfördelning) är typvärde och medelvärde lika, men i allmänhet kan de skilja sig.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Välj det korrekta av alternativen nedan:

A) Att begå ett typ II-fel innebär att vi inte förkastar en nollhypotes som är korrekt.
(Committing a type II error means that we do not reject a null hypothesis that is correct.)

B) Att begå ett typ II-fel innebär att vi förkastar en nollhypotes som är korrekt.
(Committing a type II error means that we reject a null hypothesis that is correct.)

C) Att begå ett typ II-fel innebär att vi förkastar en nollhypotes som är felaktig.
(Committing a type II error means that we reject a null hypothesis that is incorrect.)

D) Att begå ett typ II-fel innebär att vi inte förkastar en nollhypotes som är felaktig.
(Committing a type II error means that we do not reject a null hypothesis that is incorrect.)

A

D) Att begå ett typ II-fel innebär att vi inte förkastar en nollhypotes som är felaktig.
(Committing a type II error means that we do not reject a null hypothesis that is incorrect.)

Förklaring:
I hypotesprövning finns två typer av fel:

Typ I-fel (α): Vi förkastar en sann nollhypotes → Vi drar en felaktig slutsats om att det finns en effekt trots att det inte gör det.
Typ II-fel (β): Vi misslyckas med att förkasta en falsk nollhypotes → Vi upptäcker inte en verklig effekt.
Typ II-fel innebär alltså att vi inte förkastar
𝐻0 trots att det borde ha förkastats, eftersom 𝐻0


är felaktig.

Vad det innebär:
Exempel:
Om vi testar ett nytt läkemedel och nollhypotesen säger att läkemedlet inte har någon effekt, men läkemedlet faktiskt fungerar, då gör vi ett typ II-fel om vi inte förkastar nollhypotesen och missar att upptäcka effekten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Fråga:
Den centrala gränsvärdessatsen säger att:
The central limit theorem states that:

Välj ett alternativ:

Stickprovsmedelvärden är normalfördelade om stickproven är tillräckligt stora
(Sample means are normally distributed if sample size is sufficiently large)

Populationsmedelvärden är normalfördelade om populationerna är tillräckligt stora
(Population means are normally distributed if populations are sufficiently large)

Populationer är normalfördelade om de är tillräckligt stora
(Populations are normally distributed if sufficiently large)

Värdena i ett enskilt stickprov är normalfördelade om stickprovet är tillräckligt stort
(Sample values are normally distributed if the sample is sufficiently large)

A

Ja, påståendet “Ett högre värde på den ena variabeln sammanfaller i regel med högre värden på den andra variabeln.” beskriver positiv korrelation.

Förklaring:
Om högre värden på en variabel (t.ex. X) ofta sammanfaller med högre värden på en annan variabel (t.ex. Y), betyder det att det finns en positiv korrelation mellan variablerna.
Detta innebär att när X ökar, tenderar även Y att öka.
Exempel:
Studietimmar och betyg – Ju mer en person studerar, desto bättre betyg tenderar de att få.
Lön och arbetslivserfarenhet – Ju fler år av erfarenhet, desto högre lön tenderar man att få.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly