Uge 8 - Deskriptiv statistik Flashcards

(12 cards)

1
Q

Hvilke 3 målinger er der i Central tendency, og hvornår bruges de?

A
  • Type tal (mode): det tal der optræder flest gange (hyppigst). Påvirkes ikke af outliers. kan være problematisk hvis der er flere lige høje højste score, fordelingen er så bimodal. bruges ofte når daten er nominal-
  • Medianen (mdn): det tal der sådan fysisk er i midten hvis du opstiller, tallene på en række: påvirkes ikke af outliers eller skewed fordelinger. Og er ofte ikke repræsentativt i små samples
  • Middelværdi (mean) (m): gennemsnittet. påvirkes let af outliers. og bruges når dataen er ca normaltfordelt og kontinuerlig.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad er skew og hvilke former former for skew findes der?

A

Data er skewed hvis dataen er mast til en af siderne.
- En symmetrisk fordeling er en klokke form (normal fordeling)

  • positivt skewed: flest observationer i den lave ende færrest i den høje.
    (halen/pilen peger mod de høje/mere positive tal.
    Huske regel: hvis det er eksamens karakterer: Du er postivly skrewed hvis karakterende er positively skewed distribueret (fordi der så vil være flest der har fået lave karakterer)
  • Negativt skævt fordelte (Negatively skewed): er når der er mange observationer i de høje værdier og færre i de lave. (halen/pilen peger på den lave ende)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad er kurtosis distribution?

A

Kurtosis: i hvilken grad observationer samler sig i enderne/halerne af distributionen (Fields dif)

Kurtosis beskriver graden af observationer/ score der enten er

Leptokurtiv/ positiv fordeling: observationerne samler sig imod midten og grafen er høj og tynd. De har lav Standard deviation

Platykurtic/ negativ fordeling: observationerne brædder sig mod enderne/ halerne og bliver lavere og fladere. De har høj Standard deviation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvad er outlieres?

A

Outliers er ekstreme score/ observationer fundet ude i enderne af fordelingen.

Det kan være helt legitimt men kan ofte tastefejl i dataen eller problemer i målingen,

Outlieres er problematisk ved bl.a. udregning af den centrale tendenser (mean) og spredning

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Beskriv de 6 målinger beregner spredningene/afvigelsen? (Rang, deviation, total error, sum of squares, variation og Standard deviation)

A
  1. Range – Variationsbredde. Måler forskellen mellem højeste og laveste værdi, og tager ikke højde for observationerne i mellem)
  2. Deviation – Afvigelse (hvor meget en værdi afviger fra gennemsnittet)
  3. Total Error – Samlet fejl Er summen af alle afvigelser men dette bliver altid 0 derfor bruger man sum of squares
  4. Sum of Squares – Kvadratsum (summen af de kvadrerede (i 2.) afvigelser fra gennemsnittet)
  5. Variation – Varians (gennemsnittet af kvadratsummen – måler den gennemsnitlige spredning i 2. pr observation )
  6. Standard Deviation – Standardafvigelse (kvadratroden af variansen- bruges ofte som mål for spredning): måler den gennemsnitlige afvigelse pr observation i samme måleenhed som observationerne.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvordan påvirker Standard afvigelsen Kurtosis?

A

Standard deviation/ standard afvigelsen viser numerisk hvor meget spredningen der er eller hvor meget scorene samler sig.
Leptokurtiv/ positiv fordeling: Høj og tynd har en lav standard deviation ift mean
Platykurtic/ negativ fordeling: Lav og bred har en høj standard deviation ift mean

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad er z-score og hvad siger den noget om?

A

En z-score fortæller dig, hvor mange standardafvigelser en observation ligger over eller under gennemsnittet.

Z-scorer er distancen fra en bestemt observation til mean målt i SD. Z-score bruges til at beregne sandsynligheden/ probability for at få en bestemt score. Man kan med z-score finde den præcise sandsynlighed for at få en bestemt score der er højere, eller lig med en bestemt score - eller sandsynligheden for at få en score der er mindre, eller lig med en given værdi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Z-score omregner automatisk hvilken som helst fordeling til en normalfordeling. Hvad vil Mean og Standard divisionen være for denne normalfordelingen og hvorfor andres fordelingen?

A

Gennemsnit (Mean) = 0 og en Standardafvigelse = 1.

Man gør det, fordi forskellige datasæt kan have forskelligt gennemsnit og spredning, z-score gør det nemt at sammenligne tal fra forskellige datasæt eller skalaer. Fordi den blot ser på antallet af standard afvigelser fra mean.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Z-score aflæses i i Andy Field (s.1033) Her ses sandsynligheden for opnå en bestemt score. når tabellen aflæses skal man være opmærksom på bestemte cut off’s for 95%, 99% og 99,9% hvad er disse cut off’s

A

95% af z-score falder mellem -1,96 og 1,96
99% af z-score falder mellem -2,58 og 2,58
99,9% af z-score falder mellem -3,29 og 3,29

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvad er forskellen på Z-score og p værdi?

A

Z-score: viser hvor langt en værdi er fra gennemsnittet

P-værdi: Viser hvor sandsynligt det er at få resultatet tilfældigt hvis nulhypotesen er sand. P værdi vurdere signifikans

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvad betyder det at en Z-score er et minus tal vs et positivt tal?

A

En z-score viser, hvor mange standardafvigelser en observation ligger fra gennemsnittet.
- En positiv z-score = værdien ligger over mean
- En negativ z-score = den ligger under mean

Når du bruger z-tabellen (Andy Field A1- Table of the standard normal distribution), ignorerer du fortegnet (- eller + ) og slår bare selve tallet op.
Fortegnet hjælper ift. om du skal bruge den larger portion eller den smaller portion i tabellen:

Ved en negativ z-score ligger observationen under mean, og derfor er larger portion det, der ligger over værdien og smaller det der ligger under.

Og omvendt ved positive z-score

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvad er bootstrapping?

A

Bootstrapping er en metode, hvor man gentagne gange laver nye stikprøver ud fra sit datasæt ved at tilfældigt udvælge personer. Det bruges til at beregne, hvor meget en værdi (f.eks. et gennemsnit, en procentdel, en forskel mellem grupper osv.) kan variere. Et 95 % konfidensinterval viser, hvor vi forventer, at den sande værdi i populationen ligger i 95 ud af 100 tilfælde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly