Tenta 02-06-2021 Flashcards

1
Q

Du vill studera hur tillväxttakten för en krukväxt beror på temperaturen, jordens kvävehalt samt om växten står i en kruka av plast, betong eller terrakotta. Ställ upp en ekvation för analys med multipel linjär regression.

A

Vad krukan för växten är gjord av är en kvalitativ variabel. Vi kan då göra den till kategoridata:
Variabel 1: 1 om plast, 0 annars
Variabel 2: 1 om betong, 0 annars
0 och 0 på båda variablerna indikerar att krukan är av terrakotta.

Den beroende variabelt är tillväxttakten y. Så jag testar de oberoende variablerna, en för sig mot tillväxttakten, utan att ta hänsyn till de andra med enkel linjär regression. Den variabel med mest signifikant lutning läggs till modellen.

Tar sedan reda på vilken variabel som förklarar mest av kvarvarande variabiliteten och lägg till modellen. Gör så tills det inte blir någon signifikant skillnad.

Tillslut fås en modell liknande

y = beta_0 + beta_1x1 + beta_2x2 + beta_3*x3 + epsilon där beta är konstanter, y tillväxttakten och x variablerna.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

a) Vilken är nollhypotesen i ANOVA?
b) Vilket statistiskt test används för att testa nollhypotesen?
c) Varför bör man inte testa de tre grupperna mot varandra parvis?

A

a) Nollhypotesen är att variablerna oberoende och varianserna lika. Alltså att effekten av vaccinen är oberoende av varandra och att varianserna för varje vaccin är lika.
b) Man kan använda sig av variansanalys och Sum of Squares.
SST = varians mellan stickproven
SSE = variation inom stickproven
SS = Summan av SST och SSE

Dessa beräknas m.h.a. varians och medelvärden. Analyserar vi våra sum-of-squares får vi information om teststorheten F och om den är större än det kritiska värdet F(k-1,N-k) som fås ur tabell. Om så är fallet vet vi att minst ett av medelvärdena skiljer sig från varandra.

c) Man bör inte göra det eftersom man då behöver göra fler test och för varje test man gör finns en risk för typ 1-fel (alltså att man förkastar H_0 trots att den är sann).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad innebär följande begreppen “citeringsfönster” respektive “normering” inom bibliometrin och hur kan de användas?

A

När man mäter hur många citeringar en artikel får kan man göra det över en viss tidsperiod, ett s.k. citeringsfönster. En artikel publicerad t.ex. 2010 mäter man citeringar 2011 och 2012. Undviker självciteringar.

Normering: Man mäter lika mot lika. Jämför t.ex. antal citeringar till en forskares artiklar inom ett fält mot världsgenomsnittet i det fältet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vilka två parametrar studerar man huvudsakligen när man vill bedöma en forskares produktivitet och forskningens kvalitet? Diskutera vilka fördelar och begränsningar dessa parametrar har.

A

Skulle säga att för produktivitet kan man titta på antal publicerade artiklar. För kvalitet kan man helt enkelt titta på antal citeringar.
Svagheter som dessa har är bl.a. att skillnader mellan olika fält kan göra det svårare att publicera i ett visst fält än ett annat. Skillnader i hur många artiklar man kan publicera då.
Skillnader i vad som krävs för att få stå med som medförfattare.

Man kan också titta på h-index. En forskares h-index är n om denne skrivit minst n artiklar som vardera citerats minst n gånger.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly