Medicinsk statistik 1-4 Flashcards Preview

Statistik > Medicinsk statistik 1-4 > Flashcards

Flashcards in Medicinsk statistik 1-4 Deck (90)
Loading flashcards...
1

Vad är ett stickprov, varför görs det?

Vad används statistiken till sen?

En viss mängd individer som plockas ut slumpmässigt ur en population. Görs för att få en mängd som kan hanteras datatekniskt. 

 

Utifrån resultatet kan man sedan dra slutsatser kring den bakomliggande populationen. Kräver inferentiell eller analytisk statistik. Gör skattningar och hypotesprövningar. 

2

Förklara deskriptiv statistik

Vad används det för?

Går ut på att beskriva och sammanfatta en samlinga data

Används för att beskriva urvalet, dvs det undersökningen baserats på. Kan t.ex. vara urvalsstrolek, mätnivå mm --> beskriver hur materialet ser ut --> läsaren får en snabb överblick utan att behöva sätta sig in i varje individ och variabel som studerats. 

3

Förklara följande datatypers innebörd

- Kategorisk data (Nominal resp. ordinal skala)

- Numerisk data 

 

Kategorisk data: Kan delas in i olika grupper på en skala.

Nominal skala: Skala med endast två nivåer, t.ex. ¨sjuk eller inte sjuk¨

Ordinal skala: Skala med flera olika nivåer. T.ex. självskattningsskalor Kan beräkna typvärde, median, percentiler men inte aritmetiskt medelvärde. 

Numerisk data: Värdet står för något exakt, t.ex. längd, mängd eller vikt. 

- Intervallen mellan stegen i skalan är konstanta.

- Skalor kan vara kontinuerliga (längd eller vikt) eller diskontinuerliga (antal sjuka) 

4

Vad innebär centralmått och typvärde? ​

Centralmått: Det mittersta värdet där man sorterat observationerna i storleksordning.

Typvärde: Det mest förekommande värdet. 

5

Förklara innebörd av symmetrisk kontinuerlig data samt asymmetrisk kontinuerlig data

Symmetrisk: Tyngpunkt ligger mitt i. Kan använda både medelvärde eller median, men väljer oftast medelvärdet.

Asymmetrisk: Datan är förskjuten. Medelvärdet är oftast mindre än medianen. --> använder helst medianen.

- T.ex. vid många biologiska prov. 

6

Förklara ordinaldata.

Medelvärde eller median?

Det numeriska värdet är en etikett. Självskattningsskalor t.ex. 

- Medianen används, då det är en rangordning 

7

Vad fås om man tar roten ur variansen?

Standardavvikelsen, dvs den genomsnittliga avvikelsen från medelvärdet 

8

Lägesmått

Vad är skillnad mellan median och medelvärde?

Fördelar med de olika?

Medelvärde: Addera alla värden för observationerna. Dela på antalet observationer. Påverkas av extremvärden.

Median: Det mittersta värdet. Bättre att använda vid extremvärden eller ojämnt fördelad data. 

9

Vad är ett spridningsmått?

Ett sätt att beskriva hur koncentrerad data är omkring centralvärdet 

10

Vilka centralmått resp. spridningsmått används vid symmetriskt fördelad data?

Vilka centralmått resp. spridningsmått används vid asymmetriskt fördelad data?

Vilka centralmått resp. spridningsmått används vid ordinal data?

Vilka centralmått resp. spridningsmått används vid nominal data?

Symmetrisk: Medelvärde och varians eller standardavvikelse

Asymmetrisk: Median och percentiler eller kvartilavstånd 

Ordinal data: Median samt percentiler

Nominal data: Typvärde. Inget spridningsmått 

11

Normalfördelning. Hur stor del av alla mätvärden hittas mellan +/- 1, 2 resp 3 standardavvikelser?

1: 68,2 %

2: 95,4 %

3: 99,6 % 

12

Vad kan man se i ett lådagram (box-plot)?

 

 

Medianvärde, övre och nedre kvartil, samt största och minsta värde (EJ EXTREMVÄRDEN)

- Extremvärden kan ses som prickar 

13

Beskriv skillnader mellan parametriska och icke-parametriska tester

- Vad baseras de på?

- Krävs normalfördelning?

- Konfidensintervall och P-värde

Parametriska: Baseras på olika värden. Kräver normalfördelning. Ger konfidensintervall och P-värde

 

Icke-parametriska: Baseras på rangordning. Kräver INTE normalfördelning. Ger P-värde men ej konfidensintervall

14

Vad är viktigt om man tar bort eller korrigerar extremvärden?

Att skriva detta i metoden

15

Vad innebär statistisk interferens?

Att man drar slutsatser om en population baserat på resultatet från urvalet

- Uppskattningen är aldrig exakt --> osäkerheten kan uttryck som standarfelet

16

Vad är standardfel (standard error, SE)?

Vad beror det på och hur räknas det ut?

Den osäkerhet som finns vid statistisk interferens, dvs då man drar slutsatser om populationen utifrån urvalets resultat. 

 

SE beror på spridningen av data, dvs är variansen stor eller liten, samt antalet observationer. 

Stor varians --> större SE, vilket innebär att osäkerhet är större när man försöker dra slutsatser kring populationen. 

Om antalet obsevationer är stort, blir SE mindre och säkerheten större. 

17

Vad är konfidensintervall och hur beräknas det?

Ett konfidensintervall är ett intervall som med en viss säkerhet (ofta 95 %) täcker punktskattningen (ofta ett medelvärde), som gjorts utifrån stickprovet.

T.ex. om medellivslängden i stickprovet var 75 år och konfidensintervallet = 70-80 år (95 %) --> det är 95 % sannolikhet att medellivslängden ligger mellan 70-80 år. 

Beräknas utifrån standardfelet (SE). Om SE är stort blir konfidensintervallet bredare.

- Beroende på vilket sannolikhet man vill ha att gissa rätt används en konstant för uträkningen.

Konfidensintervall = punktestimat +/- (konstant x SE)

18

Vad är ett referensintervall?

Hur beräknas det?

Istället för att uppskatta medelvärdet i populationen (likt konfidensintervall) säger referensintervall något om var man kan förvänta sig att hitta enskilda observationer i populationen

T.ex. om födelsevikten för barn i en population har ett referensintervall på 2700 - 4200 g innebär detta att 95 % av barnen som föds har ett värde som ligger däremellan. 

Beräknas utifrån medelvärde och standardavvikelse --> säger något om spridningen av enskilda observationer. 

- Referensintervall = medelvärde +/- (1,96 x standardavvikelsen)

19

Vad krävs för att man ska kunna använda sig av konfidensintervall och referensintervall?

Att stickprovet är representativt för målpopulationen samt att kontinuerlig data är normalfördelad. 

20

Vad innebär nollhypotes resp. alternativhypotes (ensidig och tvåsidig)?

 

Nollhypotesen (H0): Säger att det inte finns någon skillnad mellan två grupper, behandlingar eller metoder i populationen.

- Ofta denna som testas, för att sedan förkastas eller accepteras --> KAN ALDRIG BEVISAS

Alternativhypotesen: Säger att det finns en skillnad/effekt mellan två grupper, metoder eller behandlingar i populationen.

Ensidig: Säger något om riktningen på skillnaden, t.ex. ökar eller minskar.

- Tvåsidig: Säger bara att det finns en skillnad, men anger inte åt vilket håll. 

21

Vad står P-värde för?

Vad är signifikansnivå och hur kopplas det till P-värde?

P-värde = probability value --> sannolikhet att erhålla resultatet eller mer extrema resultat även om nollhypotesen är sann

- Om P-värdet är 1 % betyder detta att 1/100 försök skulle ge ett sådant resultat även om nollhypotesen stämde. 

Signifikansnivå: Den gräns man sätter för att det ska vara motiverat att förkasta nollhypotesen

- Kan ses som en gräns för när resultatet kan antas bero på en slump, eller då denna risken är försumbar.

- Kallas även för a-nivå

- Ofta sätter man att P-värdet ska vara under 0,05 (5 %) för att nollhypotesen ska kunna förkastas, dvs att risken att resultatet beror på en slump är försumbar. 

22

När kan CI (konfidensintervall) och P-värde användas för hypotesprövning?

 

Vid normalfördelad data: Konfidensgrad + signifikansnivå = 1

- T.ex. 0,95 + 0,05 = 1.

- Om nollhypotesen ligger utanför CI kan den förkastas. 

CI ger en uppskattning om storleken på skillnaden, och säger inte bara att resultatet är signifikant (likt P-värde)

23

Vad innebär statistisk signifikans?

Klinisk signifikans? 

Att man med stor sannolikhet kan förkasta nollhypotesen. 

- Resultatet kan dock vara kliniskt meningslöst --> måste bedöma klinisk relevans

24

Vad skiljer deskriptiv statistik från analytisk?

Analytisk: Dra slutsatser om populationen man gjorde stickprov från.

Deskriptiv: Beskriva hur datafördelningen i stickprovet såg ut. 

25

Vad är en variabel?

Något/en egenskap som kan anta olika värden. 

26

Skalor, förklara och ge exempel på:

Nominal

Ordinal

Intervall

Kvot

- Vad är metrisk data, och vilka skalor används för att presentera denna?

Kategoriska:

- Nominal: Olika kategorier, utan inbördes rangordning. T.ex. typ av diagnos, utbildningsprogram. Presenteras ofta i andelar. 

- Ordinal: Kategorier med inbördes rangordning, t.ex. självskattningsskalor. Kan dock inte säga EXAKT HUR STOR skillnaden är mellan olika kategorier. Eventuella nummer är endast ¨etiketter¨. 

Numeriska: Värdet står för något exakt, där siffran betyder något. T.ex. vikt, reaktionstid, antal barn osv. Kan vara diskreta (endast heltal, t.ex. antal barn) eller kontinuerliga (kan ha vilket värde som helst, t.ex. vikt) 

- Intervall: Olika kategorier som rangordnas, där man vet hur mycket det skiljer mellan de olika grupperna, t.ex. temperatur. Saknar nollpunkt.

- Kvot: Likt intervallskala, men har en nollpunkt, t.ex. längd och vikt

27

Vad spelar skalnivån för roll?

Skallnivån styr valet av deskriptiv presentation. T.ex. presenteras en nominalskala ofta som andelar.

Olika skalnivåer passar bra för olika test.

28

Vilka frågor är viktiga att ta hänsyn till vid presentation av metrisk data (intervall och kvotskalor)?

Hur kan de presenteras?

Var ligger tyngdpunkten?

Hur stor är spridningen?

- Avgör t.ex. om det ska presenteras som en normalfördelning eller boxplot

29

Vilket centralmått används för att rangordna data vid ordinaldata?

Egentligen används median, men i praktiken används ofta medelvärde, t.ex. för självskattningsskalor. 

30

Hur stor andel av mätvärdena ligger mellan 25e och 75e percentilen?

50 %