Kapittel 10 - Beskrivelse og analyse av data Flashcards

1
Q

Hvordan analyseres kvantitativ data?

A

Gjennom dataanalyser der kompleks informasjon reduseres til en forenklet beskrivelse, enten det er i form av tall, tabeller eller grafer. Det er altså en oppsummering av skårer i en statistikk (eks; gjennomsnittet), tabeller og grafer.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

Hva er beskrivende statistikk og slutningsstatistikk?

A

Statistikk anvendes på to måter: (1) for å beskrive resultater fra et utvalg (beskrivende) og (2) for å trekke konklusjoner om en populasjon på grunnlag av data fra et utvalg fra denne populasjonen (slutnings)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Nevn et eksempel der man bruker beskrivende statistikk.

A

For eks. når en bruker gjennomsnitt, altså summen av en rekke verdier delt på antallet verdier, som gir et forenklet uttrykk for en gruppe tall (eks; gjennomsnittskarakteren er 2,33 for enkeltkarakterene i en klasse).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Nevn to gode statistikkprogrammer

A

SPSS og Statistica (men man kan også gjennomføre avanserte analyser på et regneark i Excel)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvordan plasseres variablene og deltakerne/casene i en statistisk analyse på datamaskin?

A

Variablene organiseres i kolonner
Hver deltaker/case har sin egen linje

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hva er en scatterplot/spredningsdiagram?

A

En type graf som ofte brukes for å illustrere korrelasjon mellom to variabler.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Beskriv forskjellen på diskrete og kontinuerlige variabler

A

Begge har som hensikt å beskrive skårer i et utvalg.

Den typiske statistiske prosedyren ved en diskret variabel er frekvensfordeling (frekvens av karakterene i et utvalg), mens det er gjennomsnitt, variasjon og skjevhet ved en kontinuerlig variabel (gjennomsnittlig karakternivå i en klasse).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Når er det meningsfullt å bruke gjennomsnitt som mål på sentraltendens?

A

Når utvalget har ganske mange skårer
Skårene er tilnærmet normalfordelt
Det ikke er svært avvikende skårer i utvalget.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvilke tre mål er det på sentraltendens?

A

Median: skåren som deler gruppen i 2, med 50% over og 50% under verdien.

Modus: skåren som inntreffer hyppigst i utvalget.

Gjennomsnitt: sum av enkeltskårer / antall skårer

Ved en normalfordeling av skårene vil disse sammenfalle, og motsatt vil de slå forskjellig ut dersom det ikke er det.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hva er en “uteligger”?

A

En verdi i et datasett som er sterk avvikende fra resten. Dette kan skyldes feil ellers er de bare avvikende. Kan også kalles en ekstremverdi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hva er variasjonsbredden?

A

Forskjellen mellom høyeste og laveste verdi (de to mest avvikende verdiene)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hva er en skjevfordeling?

A

Avvik fra normalfordelingskurven der toppen vil ligge mot høyre eller venstre side, og der mode, median og gjennomsnitt ikke vil sammenfalle.

Skiller mellom positiv og negativ skjevfordeling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hva er forskjellen på en unimodal og bimodal fordeling?

A

Normalfordelingskurven er unimodal, fordi den har én topp. En bimodal fordeling vil ha to topper.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hva er persentiler?

A

Persentiler angir en rangorden i et sett skårer.
“Hvis en skår på 65 lå på den 70. persentil, vil dette innebære at 70% av studentene hadde lik eller en svakere karakter, og 30% hadde en bedre karakter”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hva er et konfidensintervall?

A

Angir et “slingringsmonn” når vi beregner gjennomsnittet for et utvalg, der hensiktene er å si noe om populasjonens gjennomsnitt.

“Når vi beregner gjennomsnittet for et utvalg, vil vi kunne angi en grense for akseptabel feilmargin i forhold til populasjonsgjennomsnittet. La oss anta at 5% anses å være en akseptabel feilmargin. Når vi beregner gjennomsnittet (og tar i betraktning antallet som inngår i utvalget, samt spredningen i utvalget) vil vi for eksempel beregne at gjennomsnittet er 178, 2 med en feilmargin fra 177,6 til 179,4. Vi kan altså med høy sikkerhet, anslå at populasjonens gjennomsnitt ligger mellom disse verdiene “

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Nevn to forutsetninger som korrelasjonskoeffisenten bygger på.

A

At begge variablene er på intervall- eller rationivå. Brytes dette blir r, vanskelig å tolke. Finnes varianter av r som tillater avvik fra dette; finne korrelasjonen mellom inntekt (intervall) og kjønn (nominal).

At relasjonen mellom de to variablene kan fremstilles som en tilnærmet rett linje.

16
Q

Hva er effektstørrelse i korrelasjonskoeffisent?

A

r= 0,1 - liten ES
r= 0,3 - medium ES
r= 0,5 - stor ES

17
Q

Hvorfor må styrken på korrelasjonskoeffisenten tolkes forsiktig?

A

Verdiene av r befinner seg på ordinalnivå. Altså vil ikke en r= 0,60 være dobbelt så sterk som r= 0,30.

18
Q

Vil en sterk korrelasjon indikere kausalitet?

A

Nei ikke isolert sett. Den måler samvariasjonen mellom to variabler og tolkningen må forskeren stå for. Det er ikke korrelasjonen som tillater oss å trekke slutning om kausalitet, men designet som er brukt.

19
Q

Beskrivende statistikk kan lett gi et villedende eller til og med galt inntrykk av data. Nevn noen

A

Grafikk uten kontekst: Et ofte brukt triks er å ta forskjellen ut av sin konteks.

Lie factor: Overdrivelse i den grafiske fremstillingen, som kan uttrykkes i “løgnfaktoren”, hvis formel er enkel: LF = størrelsen av effekten som vises i grafikken / størrelsen av effekten i dataene.

Manipulasjon av skalaen: kan skape et villedende inntrykk av hva dataene egentlig viser

Korrelasjon som “bevis” på enighet: korrelasjonsanalyser kan indikere gøy grad av korrelasjon, selv om nivåene på de to variablene er ulike.