Tölfræði frá grunni / 4 Flashcards

1
Q

Hvað er Lýsistærð (statistic)?

A

Lýsistærð er tala sem verður reiknuð með einhverjum ákveðnum hætti út frá mælingunum okkar.

Dæmi um lýsistærðir eru lýsistærðin meðaleinkunn, reiknuð út frá öllum lokaeinkunnum.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvað eru vísar (indexes) ?

A

Gerum ráð fyrir að við höfum b mælingar á tiltekinni breytu, Tölurnar 1,…,n, sem mælingarnar eru tölusettar eftir kallast vísar (e. indixes) mælinganna.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvað er Miðja mælinga (central tendency)?

A

Þegar við finnum miðju mælinga fyrir tiltekna breytu reiknum við út þá tölu sem er samtímis næst öllum mælingunum á breytunni okkar í einhverjum skilningi. Til þess eru nokkrar ólíkar aðferðir sem geta gefið ólíkar niðurstöður.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvað er Miðja spannar (mid range)?

A

Miðja spannar er meðaltal stærstu og minnstu mælinganna. Hún er gífurlega viðkvæm fyrir útlögum (breytist mikið eftir því hvort og hvaða útlagar eru í mælingunum) og því ekki mikið notuð í tölfræðiúrvinnslu. Hún getur þó verið gagnleg ef mælingarnar dreifast þétt um miðjuna. Eingöngu er hægt að lýsa talnabreytum með miðju spannar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvað er Tíðasta gildi (mode)?

A

Tíðasta gildið er sú útkoma sem oftast kemur fyrir í mælingunum okkar. Það er sú eina af lýsistærðunum fyrir miðju sem er fjallað um í þessari bók sem er hægt er að nota til að lýsa óröðuðum flokkabreytum. Hins vegar er ekki við hæfi að reikna tíðasta gildið þegar mældar eru samfelldar talnabreytur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvað er Miðgildi (median)?

A

Miðgildi er sú mæling sem er í miðju mælisafnsins ef þeim er raðað í stærðarröð. Helmingur mælinga í safninu eru minni en miðgildið og helmingur er stærri. Útlagar hafa lítil sem engin áhrif á miðgildi og einnig gefur það góða mynd af miðju mælinganna þó dreifing þeirra sé skekkt. Miðgildi er því mikið notað til að lýsa miðju mælinga. Miðgildi má nota til að lýsa öllum talnabreytum en einnig röðuðum flokkabreytum.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvað er Meðaltal (mean, arithmetic mean)?

A

Meðaltal er án vafa algengasta lýsistærðin fyrir miðju mælinga. Þó er það viðkvæmt fyrir útlögum og einnig gefur það ekki rétta mynd af miðju mælinganna ef dreifing þeirra er skekkt. Meðaltal er eingöngu hægt að reikna fyrir talnabreytur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvað er Vegið meðaltal (weighted mean)?

A

Þegar meðaltal er reiknað fá allar mælingarnar sama vægi. Í sumum tilfellum viljum við gefa mælingunum misjafnt vægi, þá er talað um vegið meðaltal. Vegið meðaltal er eingöngu reiknað fyrir talnabreytur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Miðgildi vs meðaltal?

A

Útlagar geta haft mikil áhrif á meðaltal. Hins vegar hafa þeir ekki mikil áhrif á miðgildi og því er miðgildi betri mælikvarði á miðju gagna ef útlagar eru í gagnasafninu.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvað er Breytileiki mælinga (spread)?

A

Breytileiki mælinga er aðferð sem lýsir því hversu nálægt miðju sinni mælingarnar liggja.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvað er Spönn/dreifisvið (e. range)?

A

Spönn er mismunur stærstu og minnstu mælingarinnar. Hún er því mjög viðkvæm fyrir útlögum og þar að auki er hún eingöngu reiknuð út frá tveimur af mælingunum okkar. Gildi allra hinna mælingana skipta engu!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvað er Fjórðungamörk (e. quartiles)?

A

Sé miðgildi notað til að lýsa miðju mælinga er yfirleitt við hæfi að nota fjórðungamörk til að lýsa breytileika þeira. Fjórðungamörkin eru þrjú.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvað er Fimm tölu samantekt (e. five number summary)?

A

Fimm tölu samantekt er afar hnitmiðuð og fljótleg leið til að gefa miklar upplýsingar um bæði miðju og breytileika gagnanna. Fyrir vikið er hún mikið notuð.

Fimm-tölu samantekt samanstendur af minnsta gildi (e. min), fjórðungamörkunum og stærsta gildi (e. max), þ.e.a.s.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvað er Fjórðungaspönn (e. interquartile range) ?

A

Fjórðungaspönn er reiknuð út frá fjórðungamörkunum, nánar til tekið mismunur fyrsta og þriðja fjórðungamarksins. Líkt og fjórðungamörkin ætti því að nota hana þegar miðgildi en ekki meðaltal er notað til að lýsa miðju mælinganna. Ólíkt spönn er fjórðungaspönn ekki viðkvæm fyrir útlögum og því mun áreiðanlegri mælikvarði á breytileika mælinga. Fjórðungaspönn er eingöngu við hæfi að reikna fyrir talnabreytur en ekki raðar flokkabreytur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvað er Prósentumörk (e. percentiles) ?

A

Hugmyndin að baki prósentumörkum (e. percentiles) er svipuð og sú að baki fjórðungamörkum nema í stað þess að skoða eingöngu mörkin við 25% eða 75% mælinganna getum við leyft hvaða hlutfall sem er.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvað er Dreifni/fervik (e. variance) ?

A

Dreifni lýsir fjarlægð mælinga frá meðaltali þeirra. Því er eingöngu við hæfi að nota dreifni sem mælikvarða á breytileika þegar meðaltal hefur verið notað til að lýsa miðju mælinganna. Þar af leiðandi er eingöngu hægt að reikna dreifni fyrir talnabreytur.

17
Q

Hvað er Staðalfrávik (e. standard deviation) ?

A

Staðalfrávik mælinga er einfaldlega kvaðratrótin af dreifni þeirra. Því ætti, líkt og með dreifnina, eingöngu að nota staðalfrávik þegar meðaltal er notað til að lýsa miðju gagna. Því má eingöngu reikna staðalfrávik fyrir talnabreytur. Staðalfrávik er sennilega mest notaða lýsistærðin fyrir breytileika mælinga og því mikilvægt að ná góðum tökum og skilningi á meðferð hennar.

18
Q

Frávikshlutfall (e. coefficient of variation)

A

Það er oft erfitt að bera saman staðalfrávik gagna þegar mælingarnar eru í misjöfnum mælieiningum eða meðaltal þeirra er mjög frábrugðið. Í þeim tilvikum reiknum við frávikshlutfall til að bera saman breytileika tveggja eða fleiri hópa. Það er táknað með CVCV.

19
Q

Hvað er fylgnistuðull ?

A

Fylgnistuðull úrtaks eða einfaldlega fylgni er lýsistærð sem lýsir sambandi tveggja samfelldra talnabreyta. Fylgnistuðul getum við eingöngu notað til að lýsa línulegu sambandi .

20
Q

Við segjum að samband tveggja breyta sé línulegt (e. linear) ef ?

A

Nota má jöfnu beinnar línu til spá fyrir um gildi annarrar breytunnar breytunnar út frá gildi hinnar. Breytan á x-ás kallast óháða breytan en breytan á y- ás kallast háða breytan.

21
Q

Hvað er Fylgnistuðull úrtaks (sample coefficient of correlation)?

A

Fylgnistuðullinn rr er alltaf á bilinu -1 til 1. Sé hann nálægt núlli segjum við að það sé lítil fylgni milli breytanna en sé hann nálægt 1 eða -1 segjum við að það sé mikil fylgni milli þeirra.

Mikilvægt er að muna að fylgni og fylgnistuðull eru aðeins mælikvarðar á línulegt samband.

22
Q

Hvað er Stefna línulegs sambands?

A

Formerki fylgnistuðulsins segir til um það hver stefna línulegs sambands er. Hún er annað hvort jákvæð eða neikvæð. Ef fylgnistuðull tveggja breyta er jákvæður segjum við að fylgni þeirra sé jákvæð. Ef fylgnistuðull tveggja breyta er neikvæður segjum við að fylgni þeirra sé neikvæð.

23
Q

Hvað er Styrkleiki línulegs sambands ?

A

Algildi (e. absolute value) fylgnistuðuls lýsir styrkleika línulega sambandsins sem gildir milli breytanna. Hann segir okkur hversu vel við getum ákvarðað gildi svarbreytunnar út frá gildi skýribreytunnar.

24
Q

Hvað er Áhættuhlutfall (e. relative risk) ?

A

Áhættuhlutfall (e. relative risk) er mikið notað þegar borin eru saman hlutföll í tveimur þýðum. Þá hefur annað þýðið yfirleitt tiltekinn eiginleika sem verið er að athuga en hitt þýðið er viðmiðunarþýði af einhverri gerð. Dæmi um slíkt er að bera saman algengi lungnakrabbameins hjá reykingafólki og þeim sem ekki reykja. Hér er ,,áhugaverði“ eiginleikinn reykingar en breytan sem er mæld er segir hvort viðkomandi sé með lungnakrabbamein eða ekki.

25
Q

Hvað er Gagnlíkindahlutfall (e. odds ratio)?

A

Gagnlíkindahlutfall (e. odds ratio) er notað við sömu aðstæður og áhættuhlutfall. Það hefur hins vegar þann kost fram yfir áhættuhlutföllin að gera minni kröfur um tilraunahögun þegar gögnunum er safnað.
Þegar við reiknum gagnlíkindahlutföll erum við ekki að meta líkur og vegna þess hvernig þau eru reiknuð getum við leyft okkur að velja einstaklinga af handahófi eftir því hvaða gildi breytunnar þeir hljóta (en ekki hvoru þýðinu þeir tilheyra).

26
Q

Hvað eru gagnlíkindi (e. odds) ?

A

Gagnlíkindahlutfall er hlutfall tveggja gagnlíkinda. Í stuttu máli má segja að gagnlíkindi (e. odds) séu líkurnar á því að tiltekinn atburður eigi sér stað deildar með líkunum á því að hann gerist ekki.

27
Q

Hvað eru Gagnlíkindahlutfall (odds ratio)?

A

Gagnlíkindahlutfall, táknað OR, eru gagnlíkindi breytu í þýðinu með eiginleikann sem verið er að athuga.

28
Q

Hvað er Næmi (sensitivity) ?

A

Næmi flokkunaraðferðar er fjöldi sannra jákvæðra mælinga deildur með samanlögðum fjölda sannra jákvæðra og falskra neikvæðra mælinga.

Næmi er því í raun hlutfall þeirra viðfangsefna sem flokkuð eru með eiginleikann af öllum þeim viðfangsefnum sem hafa hann í raun (hvort sem þau voru flokkuð með hann eða ekki). Hún segir okkur því hversu vel aðferðin nemur eða finnur þau viðfangsefni sem bera eiginleikann.

29
Q

Hvað er Sértæki (specificity)?

A

Sértæki flokkunaraðferðar er fjöldi sannra neikvæðra mælinga deildur með samanlögðum fjölda sannra neikvæðra og falskra jákvæðra mælinga.

Sértæki er því í raun hlutfall þeirra viðfangsefna sem flokkuð eru án eiginleikans af öllum þeim viðfangsefnum sem eru í raun á hans (hvort sem þau voru flokkuð með hann eða ekki). Hún segir okkur því hversu vel aðferðinni gengur að flokka eingöngu þau sem viðfangsefni sem bera eiginleikann, með hann.

30
Q

Hvað er jákvætt forspárgildi (positive predictive value)?

A

Jákvætt forspárgildi flokkunaraðferðar er fjöldi sannra jákvæðra mælinga deildur með samanlögðum fjölda sannra jákvæðra og falskra jákvæðra mælinga.

31
Q

Hvað er Neikvætt forspárgildi (negative predictive value)?

A

Neikvætt forspárgildi flokkunaraðferðar er fjöldi sannra neikvæðra mælinga deildur með samanlögðum fjölda sannra neikvæðra og falskra neikvæðra mælinga.