Statistik Flashcards Preview

Statistik för ekonomer > Statistik > Flashcards

Flashcards in Statistik Deck (88)
Loading flashcards...
1
Q

Vad är experimentella undersökningar?

A

Vad är experimentella undersökningar?

2
Q

Vad är icke-experimentella undersökningar?

A

En undersökning som man ofta gör efter att något inträffat, där man i efterhand försöker kartlägga dess orsaker.

3
Q

Vad är confounding?

A

Då man inom statistik gör sammanblandningar eller förväxlingar vid mätningar.

4
Q

Vad är randomisering?

A

Att man låter slumpen avgöra

5
Q

Vad är ett blindförsök?

A

Då man under ett experiment har två grupper av patienter (placebo och verklig), där ingen av deltagarna får veta i vilken grupp de hamnat.

6
Q

Vad innebär dubbel-blind design?

A

Att även personen som ska registrera mätvärdena är ovetande om vilken grupp försökspersonen tillhör.

7
Q

Vad är en kvasi-experimentell undersökning?

A

I många fall är det inte möjligt att manipulera de faktorer som vi betraktar som orsaken vid en undersökning, vilket omöjliggör ett experiment. Då kan man ibland genomföra en kvasi-experimentell undersökning, där man har en jämförelsegrupp istället för kontrollgrupp. Jämförelsegruppen väljs aktivt ut, istället för att man låter slumpen avgöra, i förhoppning att den ska likna experimentgruppen.

8
Q

Vad är en longitudinell undersökning?

A

En undersökning som innefattar en kontinuerlig insamling av data under en längre period.

9
Q

Vad är en population?

A

En grupp bestående av individer.

10
Q

Vad är en individ?

A

En person, företeelse eller ett ting som man kan göra en mätning på. Kan vara allt från företag till trafikolyckor.

11
Q

Vad är en ändlig population?

A

En population som det (i praktisk bemärkelse) går att genomföra en totalundersökning på, alltså att den består av ett begränsat antal individer.

12
Q

Vad är en oändlig population?

A

En population där det inte är praktiskt möjligt att undersöka alla individer, t.ex. vattenprover i en sjö.

13
Q

Vad är en målpopulation?

A

Den population man vill undersöka.

14
Q

Vad innebär övertäckning?

A

Att man inkluderar en individ i en undersökning som inte tillhör målpopulationen.

15
Q

Vad innebär undertäckning?

A

Att man missar en individ från en undersökning som egentligen tillhör målpopulationen.

16
Q

Vad är ett täckningsfel?

A

Då man får antingen över- eller undertäckning, vilket kan ge upphov till systematiska fel.

17
Q

Vad innebär en registrerad population?

A

Då man mäter t.ex. brottslighet är det inte möjlighet att direkt mäta på en målpopulation, då många brottslingar inte har dömts. Då kan man istället undersöka en registrerad population, i detta fallet de brottslingar som blivit dömda. En registrerad population skiljer sig med säkerhet från målpopulationen.

18
Q

Vad innebär mörkertal?

A

Att vi saknar värdefull information från individer.

19
Q

Vad är ett svarsbortfall?

A

Då en eller flera individer inte svarar på delar av eller hela undersökningen.

20
Q

Vad innebär ett klassifikationsfel?

A

Då man försöker klassificera (indela) individer i grupper, men gör detta på ett sätt som inte stämmer överens med undersökningens syfte.

21
Q

Vad är operationalisering?

A

Då man försöker konkretisera det abstrakta, för att göra det mätbart.

22
Q

Vad innebär validitet?

A

Validitet är ett mått på hur väl ett mätinstrument verkligen mäter det man vill ha mätt. En definition av validitet lyder: ”validitet är frånvaron av systematiska mätfel”. Mäter du rätt grej?

23
Q

Vad innebär reliabilitet?

A

Hur tillförlitligt en undersökning är, alltså vilken precision man får. Vill man veta hur mycket ett hårstrå väger bör man inte använda en köksvåg, och dyl. Mäter du tillräckligt noggrant?

24
Q

Vad innebär teleskopeffekten?

A

När man placerar en händelse felaktigt i tiden.

25
Q

Vad är en kvalitativ variabel?

A

En variabel som är icke-numerisk

26
Q

Vad är en kvantitativ variabel?

A

En numerisk variabel.

27
Q

Vad är en diskret variabel?

A

En kvantitativ variabel som endast kan anta vissa värden, och som oftast är heltalsvärden (antal barn, sjukdagar mm.).

28
Q

Vad är en kontinuerlig variabel?

A

En kvantitativ variabel som kan anta alla värden inom ett visst intervall, alltså i teorin ett oändligt antal värden. Dessa värden (vikt, längd, ålder mm.) måste i praktiken alltid avrundas.

29
Q

Vad innebär trunkering?

A

Att man avkortar istället för att avrunda uppåt. Görs t.ex. alltid för ålder.

30
Q

Vad är datanivåer?

A

Ett ”mått” på vilka typer av beräkningar som är möjliga att utföra med mätvärdena.

31
Q

Vad är en nominalskala?

A

Att vi klassificerar individerna efter grupptillhörighet, t.ex. partisympati eller sexuell läggning. Det förekommer ingen rangordning av grupperna, och mätvärdena är alltid kvalitativa.

32
Q

Vad är en ordinalskala?

A

En klassificering som även inkluderar någon form av rangordning, tex. en betygsskala i en recension. Ordinalskalan ger svar på om den ena filmen är bättre än den andra, men inte hur mycket bättre.

33
Q

Vad är en intervallskala?

A

En klassificering med rangordning där det är möjligt att ange skillnaden mellan mätvärdena (ekvidistans). Vi kan säga att Tobias är 5 cm längre än Maria. Det är alltså möjligt att både addera och subtrahera mätvärdena.

34
Q

Vad är en kvotskala?

A

En rangordnad klassificering med ekvidistans där vi även har en absolut nollpunkt. Vi vet att Tobias är 178 cm och Maria 173 cm, och det är därmed möjligt att bilda en kvot mellan mätvärdena, samt göra en meningsfull tolkning av denna kvot.

35
Q

Vad är en totalundersökning?

A

En undersökning av en hel population.

36
Q

Vad är en stickprovsundersökning (urvalsundersökning)?

A

En undersökning av en del av en population.

37
Q

Vad är förstörande provtagning?

A

Provtagning som de facto även förstör det man testar, t.ex. en handgranat.

38
Q

Vad innebär sannolikhetsurval?

A

Att varje individ i en population har någon sannolikhet att bli utvald.

39
Q

Vad innebär obundet slumpmässigt urval (OSU)?

A

Att man ger varje individ exakt samma stor sannolikhet att bli utvald.

40
Q

Vad är urvalsfelet?

A

Skillnaden i resultat mellan stickprov och populationen.

41
Q

Vad innebär systematiskt urval?

A

En metod som används när individerna är numrerade, där man utgår ifrån ett system (t.ex. vart 10:e) för att välja ut individer.

42
Q

Vad är stratifierat urval?

A

Då man delar in populationen efter en stratifieringsvariabel i ett antal delpopulationer, där varje individerna inom varje stratum är så lika varandra som möjligt. Därefter gör man ett obundet urval från varje stratum. Görs om en population kan delas in i olika stora kategorier, för att försäkra sig om att alla kategorier inkluderas.

43
Q

Vad är flerstegsurval?

A

Ett OSU som sker i flera steg. (Först alla skolor, sedan skolans klasser, sedan klassens elever)

44
Q

Vad är ett kvoturval?

A

Då man inte använder sig av slumpen, utan aktivt väljer individer baserat på egenskaper, för att få en stickprovsgrupp som så bra som möjligt överensstämmer med populationen.

45
Q

Vad är medvetna selektiva urval?

A

Då man medvetet väljer ut individer som man finner intressanta.

46
Q

Vad är omedvetna selektiva urval?

A

Då man omedvetandes väljer ut individer som inte korrekt representerar populationen.

47
Q

Vad innebär imputering?

A

Att man, vid frånvarande- eller felaktigt svar, fyller i svaret åt individen utefter hur en liknande individ svarat.

48
Q

Vad är kravet relevans?

A

Att vi inte bara fått ett korrekt och precist mätvärde, utan att mätvärdet i sig är relevant för undersökningen.

49
Q

Vad betyder n?

A

Antalet observationer/individer.

50
Q

Vilka diagram är lämpliga för kvalitativa variabler?

A

Cirkeldiagram och stapeldiagram.

51
Q

Vad är en stympad frekvensaxel?

A

När en axel i ett diagram inte börjar på 0.

52
Q

Vad är en fyrfältstabell?

A

En korstabell som enbart består av två rader och två kolumner.

53
Q

I ett diagram för kontinuerliga variabler, vad är klassbredden och klassmitten?

A

Klassbredden är skillnaden mellan den övre och den undre gränsen för en klass.
Klassmitten är den undre gränsen plus halva klassbredden.

54
Q

Vad är typvärdet?

A

Det vanligast förekommande värdet, alltså det värde med högst frekvens.

55
Q

Vad innebär en bimodal fördelning?

A

Att det finns två typvärden.

56
Q

Vad är medianen?

A

Det mittersta värdet i ett ordnat material.

57
Q

Vad är kumulerad frekvens?

A

Summan av de hitintills uppräknade frekvenserna.

58
Q

Vad är ett extremvärde?

A

Ett värde som kraftigt avviker från det övriga materialet.

59
Q

Vad är ett stympat medelvärde?

A

Ett medelvärde som helt struntar i extremvärden.

60
Q

Vad är regression fallacy?

A

När man tror att en insats ledde till en förändring, när det egentligen kanske var en ”return to mean”.

61
Q

Vad är en snedvridande faktor?

A

En faktor som har en påverkan på det du mäter, utöver den/de faktorer du redan gör mätningar på.

62
Q

Vad är direkt standardisering?

A

Ett sätt att komma runt en eller flera snedvridande faktorer. Det görs genom att man helt enkelt utgår ifrån att de förutsättningar som finns för A, och applicerar det för observationerna B, C , D… Om vi exempelvis är intresserade av löneskillnaden mellan två företag, men företagen har helt olika personalstruktur, så låter vi ett av företagen representera en standard för hur personalen är fördelad, och applicerar det på det andra företaget.

63
Q

Vad betyder X (versal)?

A

I sannolikhetslära betyder versaler (och X används ofta) slumpvariabler.
I statistik så betyder X en enskild observation i en population.

64
Q

Vad betyder x (gemen)?

A

I statistik så betyder x en enskild observation i ett stickprov.

65
Q

Vad betyder N (versal)?

A

Antalet individer i populationen.
ELLER
Att en variabel är normalfördelad, då skrivs det N(medelvärde, standardavvikelse) för att beskriva normalfördelningen.

66
Q

Vad betyder μ (My)?

A

Medelvärdet för en population.

67
Q

Vad betyder σ (sigma)?

A

Standardavvikelsen för en population.

68
Q

Vad betyder α (alfa)?

A

Signifikansnivån, alltså den högsta accepterade risken för ett Typ1-fel.

69
Q

Vad är ett Typ1-fel?

A

Att felaktigt förkasta nollhypotesen. Risken för detta kallas signifikansnivån, och betecknas α.

70
Q

Vad är ett Typ2-fel?

A

Att felaktigt acceptera nollhypotesen. Risken för detta betecknas β.

71
Q

Vad är stickprovsmedelvärdet?

A

Medelvärdet för ett stickprov, betecknat x̄ (x bar).

72
Q

Vad är standardavvikelse?

A

Den genomsnittliga variationen från medelvärdet. Utöver den något komplicerade formeln för standardavvikelse finns en snabbuppskattningsmetod för standardavvikelse, genom att dela variationsvidden med 4.

73
Q

Vad är variationsvidd?

A

Skillnaden mellan det största och det minsta värdet i ett datamaterial

74
Q

Vad är outlier?

A

Ett värde som ligger utom 1,5 kvartilavstånd ifrån lådan i ett lådagram.

75
Q

Vad är avlägsna outliers (extrema extremvärden)?

A

Ett värde som ligger utom 3 kvartilavstånd ifrån lådan i ett lådagram.

76
Q

Vad är varians?

A

Ett spridningsmått som definieras som standardavvikelsen i kvadrat.

77
Q

Vad är en indexserie?

A

Ett sätt att jämföra olika värden för en variabel över tid.

78
Q

Vad är basår/bastidpunkt?

A

Året man utgår ifrån i en indexserie som i index anges 100 (startvärde 100).

79
Q

Vad är vägda index?

A

Index som består av flera komponenter som vägs mot komponenternas vikt i index. Ex KPI som är sammansatt.

80
Q

Vad är ett kedjeindex?

A

Ett vägt index där man över tid kan förändra sammansättningen av varor och deras vikt i indexet.

81
Q

Vad innebär positiv korrelation?

A

Korrelation betyder att det finns ett samband mellan två variabler. Höga värden på den ena variabeln motsvaras av höga värden på den andra variabeln.

82
Q

Vad innebär negativ korrelation?

A

Korrelation betyder att det finns ett samband mellan två variabler. Höga värden på den ena variabeln motsvaras av låga värden på den andra variabeln.

83
Q

Vad är förklarande och beroende variabel?

A

I en korrelation så är den förklarande variabeln den variabel som avgör den beroende variabeln, t.ex. pris på gamla bilar avgörs av bilens ålder och inte tvärtom.

84
Q

Vad är minsta kvadratmetoden?

A

En metod för att i ett material av observationspar rita en regressionslinje. MK-metoden förutsätter minst intervallskala för mätvärdena. Regressionslinjen är den linje som i MK-metodens mening bäst beskriver genomsnittsambandet mellan variablerna.

85
Q

Vad är regressionskoefficient?

A

Samma som riktningskoefficient fast för en regressionslinje (som k i y=kx+m)

86
Q

Vad är residualen?

A

Residualen är skillnaden mellan verklighetens värden och en prediktions värden när du jobbar med regressionslinjer.

87
Q

Vad är residualspridningen?

A

Ett spridningsmått för spridningen kring regressionslinjen.

88
Q

Vad är en tidsserie?

A

Data insamlade över tid ex. temperaturen klockan 12 varje dag.