Statistik - regression Flashcards

1
Q

Vad innebär en korrelation?

Mellan vilka siffror brukar den beskrivas?

A
  • Linjärt samband mellan två variabler
  • Relation/följsamhet (ej kausalt)
    • Något ökar och det andra minskar/ökar ex
  • Korrelationskoefficient r, rho eller tau
    • -1 -< r
    • Negativ innebär att den ena ökar och den andra minskar
  • Ingen korrelation 0
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vilken metod väljer du vid korrelatinsanalys?

A
  • Pearson
    • Två kvantitativa variabler båda normalfördelade
  • Spearman
    • Övriga kombinationer (minst en som inte är normalfördelad)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad är en bra korrelation?

A
  • Pearson
    • -1 till -0,7 och 0,7 till 1 – bra korrelation
    • Om SD är högre än halva medelvärdet – indikator för att kurvan inte är normalfördelad
  • Spearman
    • Passar också vid kvalitativ/kvantitativ liksom kvalitativ/kvalitativ
    • -1 till -0,3 och 0,3 till 1 – bra korrelation
  • Korrelationskoefficient så nära 1 eller -1 stämmer alltså inte riktigt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q
  • Det står ju inte om det är Pearson eller Spearman
  • Det kan stå i text, där resultaten kan diskuteras och det där framgår
  • Men det kan också framgå om variablerna är kvantitativa eller inte
    • TV-tittande – antal timmar
    • Levnadsförhållanden – dikotom
    • Ålder – antalet år
    • Utbildning – antal år som läst

Med vilken metod har detta analyserats?

A
  • Kvalitativ variabel som har tre eller fler kategorier blir det Spearman
  • Kvalitativ variabel som är dikotom kan man använda Pearson men ovan med TV-tittande och levnadsförhållande kan ändå tittas på med Pearson eller Spearman
    • Hon brukar göra bägge, du kan ändå landa i Spearman eftersom variabeln är kvalitativ
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vad innebär en linjär regression?

A
  • Enkel linjär regretion = korrelation = minsta varianten av regretion
    • Bara en variabel som ska förklara den andra
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q
  • Multivariabel analys
    • Tre eller fler variabler som tillsammans påverkar en annan variabel

Definitionen av linjär regression är att vi har??

A
  • En variabel (y, beroende) som ska förklaras med hjälp av ett antal andra variabler (x, oberoende)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q
  • Krav som ska uppfyllas för en linjär regression?
  • Vad är en x-variabel?
A
  • Y-variabeln (kvantitativ och normalfördelad (kanske inte perfekt))
    • Vi har en diagnos – Y-variabel (ska förklaras med hjälp av andra variabler)
    • Det är denna som styr om vi får göra en linjär regression
  • X-variablerna är:
    • Allt som påverkar diagnosen – markörer, vikt, rökning –> x-oberoende variabel
      • Rökning, vikt, motion, olika markörvärden
    • Kvantitativ och normalfördelad
    • Kvalitativ men dikotom (ena eller andra svaret, 1, 0), ibland fler
  • I en och samma regression finns båda typerna av x-variabler
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Inför linjär regression

  • Hur väljer jag ut mina x-variabler?
A
  • Läsa andra studier
  • Allmänt vedertagna faktorer som vi vet påverkar och därför samlar in
  • Nytt forskningsområde, eventuellt ta hjälp av expertgrupp och bolla frågor
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Men oavsett ingång till val av x-variabler så börjar man med korrelation inför regression

Hur gör vi detta och varför?

A
  • Vi gör en korrelationsanalys för att hitta de x-variabler som har korrelation till y-variabeln (statistiskt lämpliga för att plocka med till regression)
    • Ex genom att vi har en massa variabler vi samlat in och därför prövar för korrelation gentemot y-variablen (en i taget)
    • För att se om vi hittar bra korrelation mellan respektive x-varibel
    • Om korrelation är bra så innebär det att x-variabel är av intresse och kan komma med i regression)
  • Vi gör också korrelationsanalys på de x-variabler som vi valde ut i steg 1 kolineraritet
    • Hur ser det ut mellan de utvalda x-variablerna – finns det samband – JA –> kolineraritet –> inte bra då de ska vara oberoende!! Att likställa med CONFOUNDER i epidemiologi!
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hur hanterar vi kolinearitet?

A
  • Slå ihop de x-variabler som har kolinearitet med hjälp av en matematisk formel
    • Ex räkna BMI på vikt och längd
  • Gör ett antal regressioner där vi har med, skiljer dem åt och utesluter de x-variabler som har kolinearitet
    • Plocka ut x-variabel 1 och jämför med andra x
    • Plocka ut x-variabel 2 och jämför med andra x
    • Plocka bort både 1 och 2 och jämför alla andra x med varandra
    • Utifrån detta kan vi välja den bästa regressionen utefter checklista!
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad är y- och x-variabel?

A
  • y-variabel – TV-tittande
    • Ibland i bakgrund, syfte osv
  • x-variabel inne i tabellen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Tolkning med checklista!

  • Är hela regressionen signifikant?
  • Är konstanten signifikant? (skärningspunkt för y-axeln
  • Är x-variablerna signifikanta?
A
  • Är hela regressionen signifikant?
    • Ja p-värde är mkt lågt
  • Är konstanten signifikant? (skärningspunkt för y-axeln
    • Skärningspunkt på y-axel
    • Nej constanten är inte signifikant, vilket är problem
  • Är x-variablerna signifikanta?
    • Nej inte ålder
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

​Tolkning med checklista!

Nästa steg blir en ny regression där ålder plockas bort

Hur ser det ut nu?

A
  • Detta är sättet som vi hanterar kolineraritet!
    • Uppfyller nu krav för signifikans
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Övriga bokstäver

  • t – ganska ointressant men är den som genererar p-värdet

Vad står R2 eller Adj R2 för?

A

Hur stor del av förklaringen till y står x-variabler för!!!!

  • 56,3 % (Adj R2 brukar vara en lite lägre siffra)
  • Berättar att x-variabler tillsammans förklarar 56,3 % av TV-tittandet
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q
  • Berättar att x-variabler tillsammans förklarar 56,3 % av TV-tittandet

Är vi nöjda med förklaringsgraden?

A
  • Vad är syftet med regressionen? Vad är vår förväntning på förklaringsgrad?
  • Vilka faktorer som påverkar diagnos – kräver hög förklaringsgrad
  • Vid rökning kan ex förklaringens vara lägre vid cancerutveckling
  • Längd påverkar inte att vi får lungcancer – förväntningen är låg förklaringsgrad
17
Q

Så är förklaringsgraden vid regression sanning?

A
  • Kom ihåg att glassar i sig inte leder till drunkning
  • Är det vi tittar på relevant, gör en värdering!
  • Vi tittar i någon mån på kausalt samband, men gör det med sans!
18
Q

Vad betyder B-värdet?

A
  • Y=B0 + B1 x X1 + B2 x X2 + B3 x X3
  • Vi kan då räkna ut för enskild individ – 4,6 h – (0 (lever ensam) x -1,096) – antal år utbildning x n -0,188 (ju fler år drar ner TV-tittande)
    • Sammantaget så säger det att leva tillsammans med någon och lång utbildning att vi tittar på mindre TV
19
Q

Vad säger beta?

A
  • Vilken av dessa x-variabler påverkar y-variabeln mest
  • Utbildning i detta fallet!
  • Rangordning av x-variabler – hur de påverkar y-variablen
  • Ex att någon påverkar dubbelt så mkt – 0,3 i förhållande till – 0,6 (dubbelt)