Tölfræði frá grunni / 1-3 Flashcards

1
Q

Um hvað snýst tölfræði?

A

Í stuttu máli má segja að verkefni okkar í tölfræði snúist um að nýta sem best þær upplýsingar sem við fáum með tölulegum gögnum.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Lýsandi tölfræði (e. descriptive statistics) snýst um ?

A

Að lýsa sem best því úrtaki sem við höfum í höndunum. Það gerum við bæði með því að reikna útkomur ákveðinna lýsistærða sem lýsa gögnunum en einnig með því að setja gögnin skýrt fram á myndrænan hátt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Ályktunartölfræði (e. inferential statistics) snýst um?

A

Ályktunartölfræði (e. inferential statistics) beinir kastljósinu frá úrtakinu sjálfu og að öllu þýðinu. Markmið ályktunartölfræði er að staðhæfa um allt þýðið út frá úrtaki sem við höfum mælingar á.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvað er tilraunahögun (e. experimental design)?

A

T.d. úrtakshögun, blindun og endurtekningar

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvað er “þýði” (population) rannsóknarinnar?

A

Þýði rannsóknar er safn allra viðfangsefna sem draga á ályktanir um.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvað er “úrtak” (sample) ?

A

Úrtak er safn viðfangsefna sem eru valin úr tilteknu þýði.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvað er breyta (variable) ?

A

Breyta er ákveðinn eiginleiki sem við skráum niður eða mælum á viðfangsefnunum í úrtakinu okkar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvað eru flokkabreytur (e. categorical variables) ?

A

Flokkabreytur (e. categorical variables) eru ekki mældar í tölulegum einingum, heldur segja, eins og nafnið gefur til kynna, til um það hvaða flokki viðfangsefnið tilheyrir.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hvað er röðuð flokkabreyta (ordinal categorical variable)?

A

Þegar flokkabreyta er röðuð (e. ordinal categorical variable) er flokkum hennar raðað í stærðarröð.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvað er óröðuð flokkabreyta (categorical variable) ?

A

Þegar flokkabreyta er óröðuð (e. categorical variable) er flokkum hennar ekki raðað í stærðarröð.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvað eru talnabreytur (numerical variables)?

A

Talnabreytur (e. numerical variables) taka töluleg gildi sem eru mæld í tilteknum einingum.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvað eru samfelldar breytur (continuous variables)

?

A

Þegar talnabreyta getur tekið hvaða gildi sem er á einhverju bili þá segjum við að hún sé samfelld. Eingöngu talnabreytur geta verið samfelldar.

Sem dæmi um samfelldar breytur má nefna hárlengd, þyngd, líftíma og hitastig. Lengd á einu mannshári getur verið 20 cm. Hún getur líka verið 21 cm, 20.8, 20.4 cm eða hvaða tala sem er á milli 20 cm og 21 cm. Einu skorðurnar eru nákvæmni mælitækjanna okkar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvað eru strjálar breytur (discrete variables)?

A

Ef breytur eru ekki samfelldar segjum við að þær séu strjálar. Allar flokkabreytur eru strjálar og sumar talnabreytur.

Dæmi um strjálar talnabreytur eru til dæmis fjöldi eggja í hreiðri, gildi sem kemur upp í teningakasti og heildarfjöldi marka sem skoruð eru í knattspyrnuleik.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvert er samband svarbreytna og skýribreytna (response and explanatory variables)?

A

Fyrir sérhvert viðfangsefni mun gildi skýribreytu þess hafa áhrif á það hvaða gildi svarbreytan mun taka. Til einnar svarbreytu geta svarað margar skýribreytur sem hafa áhrif á hana.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvað er breytileiki í tölfræði?

A

Breytileiki verður vegna þess að breyturnar sem við erum að skoða eru slembni háðar og því geta útkomur mælinganna breyst í hvert sinn sem tilraunin er framkvæmd.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvað er bjagi (bias) ?

A

Bjagi verður þegar aðferðirnar gefa markvisst bjagaða mynd af þýðinu sem verið er að skoða.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Munurinn á bjaga og breytileika?

A

Bjagi er í eðli sínu gerólíkur breytileika. Á meðan breytileiki er bundinn í eðli mælinganna og þannig á vissan hátt ,,sannur“ í eðli sínu, veldur bjagi því að við fáum kerfisbundið skakka mynd af viðfangsefnunum sem við erum að skoða og því viljum við lágmarka hann með öllum ráðum.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Hvað er Úrtaksbjagi (Sampling bias)?

A

Úrtaksbjagi verður þegar ákveðin viðfangsefni þýðis eru líklegri til að vera valin í úrtak heldur en önnur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Besta leiðin til að forðast úrtaksbjaga ?

A

Að velja slembiúrtak, því slembiúrtök eru laus við bjaga.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Hvað er Slembival (randomization)?

A

Það að velja slembið, eða slembival, þýðir að velja handahófskennt þannig að öll viðfangsefni eru jafnlíkleg til að vera valin.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Úrtak sem er valið með slembivali kallast ?

A

Slembiúrtak (e. random sample).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Þrjár gerðir af slembiúrtökum:

A

Einfalt slembiúrtak, lagskipt slembiúrtak og parað slembiúrtak.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Hvað er Einfalt slembiúrtak (simple random sample)?

A

Þegar við framkvæmum einfalt slembiúrtak veljum við einstaklinga af handahófi úr öllu þýðinu.

24
Q

Hvað er Lagskipt slembiúrtak (stratified random sample)?

A

Þegar við framkvæmum lagskipt slembiúrtak er þýðinu fyrst skipt niður í nokkur lög eða hópa og síðan eru viðfangsefni valin með einföldu slembiúrtaki úr hverju lagi fyrir sig. Fjöldi viðfangsefna sem valinn er úr hverju lagi verður að vera ákveðinn fyrirfram en hann má vera mismikill eftir lögum.

25
Q

Hvað er Parað slembiúrtak (paired random sample)?

A

Parað slembiúrtak fæst þegar viðfangsefnin í þýðinu eru pöruð saman tvö og tvö og síðan er ákveðinn fjöldi para valinn af handahófi í úrtakið.

26
Q

Hvað ef slembiúrtak er ógerlegt?

A

Þá er farin önnur af tveimur leiðum:

Að skilgreina þýðið upp á nýtt þannig að úrtakið verði slembiúrtak.

Að sætta sig við bjagann.

27
Q

Hvað eru sjálfboðaliðaúrtök?

A

Sjálboðaliðaúrtök eiga við þegar viðfangsefnin eru fólk og þá eru eingöngu framkvæmdar mælingar á þeim sem bjóða sig fram til þess. Hér verður úrtaksbjagi vegna þess að ákveðin viðfangsefni geta verið líklegri til að bjóða sig fram en önnur.

28
Q

Hvað eru aðgengisúrtök?

A

Aðgengisúrtök eru fengin þegar eingöngu eru framkvæmdar mælingar á þeim viðfangsefnum sem eru (þægilega) aðgengileg rannsakendum. Þar verður úrtaksbjagi vegna þess að ákveðin viðfangsefni þýðisins eru líklegri til að vera aðgengileg rannsakendum en önnur.

29
Q

Hvað er átt við með Vöntun mælinga (missing values)?

A

Ef ekki tekst að framkvæma mælingu á öllum þeim viðfangsefnunum sem hafa verið valin í úrtak er sagt að það vanti mælingu fyrir viðkomandi viðfangsefni.

30
Q

Hvað er Rannsakandabjagi (experimenters bias)?

A

Rannsakandabjagi verður þegar væntingar rannsakanda um áhrif inngrips hafa áhrif á mælingarnar á viðfangsefnunum.

31
Q

Hvað er Lyfleysa (placebo)?

A

Lyfleysa er sérhvert inngrip sem viðfangsefni telur ranglega að sé inngripið sem mæla á.

32
Q

Hvað eru Lyfleysuáhrif (placebo effect)?

A

Sá munur í mælingum viðfangsefna sem við sjáum fyrir og eftir lyfleysuinngrip köllum við lyfleysuáhrif.

33
Q

Hvað eru Tvíblindar rannsóknir (double-blind trials)?

A

Þegar rannsókn er tvíblind vita hvorki rannsakandi né viðfangsefni tilraunarinnar hvaða inngrip hvert viðfangsefni hlýtur. Athugið að inngrip getur verið lyfleysuinngrip.

34
Q

Hvað eru Einblindar rannsóknir (single-blind trials)?

A

Þegar rannsókn er einblind vita annað hvort viðfangsefnin eða rannsakandinn ekki hvaða inngripi er beitt.

35
Q

Hvað er Stýrð tilraun (controlled experiment)?

A

Til að rannsókn geti flokkast sem stýrð tilraun þurfa tvö atriði að vera til staðar:

  1. Rannsakandinn getur stýrt því hvaða viðfangsefni hljóta hvaða inngrip.
  2. Mælingar eru framkvæmdar á viðfangsefnum bæði fyrir og eftir að inngripinu er beitt.
36
Q

Hvaða skilyrði ætti stýrð tilraun að uppfylla?

A

Sérhver rannsakandi ætti að leitast við að tilraun hans uppfylli eftirfarandi skilyrði:

Úrtakshögun.

Viðfangsefni eru valin úr þýðinu með slembiúrtaki og/eða skipt í hópa með slembivali.

Blindun.

Rannsóknin er tvíblind en einblind ef því verður ekki komið við.

Endurtekningar.

Inngripinu er beitt á endurtekinn fjölda viðfangsefna.

37
Q

Hvað er Orsakasamband (causation)?

A

Orsakasamband milli tveggja breyta er þegar gildi einnar breytu hefur áhrif á þau gildi sem önnur breyta mun taka. Eingöngu verður sýnt fram á orsakasamband með stýrðum tilraunum.

38
Q

Algengustu tegundir grafa fyrir strjálar breytur eru?

A

Stöplarit (e. bar chart) og kökurit (e. pie chart).

39
Q

Hvernig er stöplarit (bar chart)?

A

Með stöplariti teiknum við eina súlu fyrir hverja útkomu breytunnar og mega þær ekki liggja hvor að annarri. Hæð súlnanna sýnir tíðni eða hlutfall viðkomandi útkomu. Raða skal súlunum svo auðvelt sé að greina upplýsingarnar.

40
Q

Hvernig er Kökurit (pie chart) ?

A

Þegar búa á til kökurit er mikilvægt að allir flokkar breytunnar sem verið er að skoða séu með á myndinni. Fjöldi sneiða í kökuritinu ræðst af fjölda flokka breytunnar. Stærð sneiðarinnar ræðst af hlutfallslegum fjölda í viðkomandi flokki af heildinni.

41
Q

Hvernig er Stuðlarit (histogram)?

A

Stuðlarit samanstendur af súlum sem standa hver upp að annarri. Fjöldi súlna ræðst af fjölda flokka sem talnabreytunni er skipt upp í. Þegar flokkarnir eru myndaðir er gott að hafa eftirfarandi í huga.

Neðri og efri mörk eiga að vera einföld og auðskilin
Bilin mega ekki skarast og verða að ná yfir allar mælingar
Bilin eiga að vera jafn breið

Flokkarnir eiga að vera hæfilega margir. Engin ein rétt lausn er til en ágætt er að nota þumalputtaregluna að fjöldi flokka á að vera u.þ.b. 5 sinnum logaritminn af fjölda mælinga

Þegar flokkarnir hafa verið myndaðir er teiknuð ein súla fyrir hvern flokk og ræðst hæð súlunnar af fjölda (eða hlutfalli) mælinga í þeim flokki.

42
Q

Dreifingu minnstu mælinganna köllum við?

A

Vinstri hala (e. left-tail) dreifingarinnar.

43
Q

Dreifingu stærstu mælinganna köllum við ?

A

Hægri hala (e. right-tail) dreifingarinnar.

44
Q

Dreifing er samhverf (e. symmetric) ef ?

A

Hægri hlið hennar dreifist eins og spegilmynd vinstri hliðarinnar.

45
Q

Dreifing sem ekki er samhverf er ?

A

Skekkt (e. skewed).

46
Q

Dreifing er skekkt til hægri (e. skewed to the right) ef hægri hali hennar er lengri en sá vinstri og skekkt til vinstri (e. skewed to the left) ef sá vinstri er lengri en sá hægri.

A

Satt

47
Q

Ef dreifingin hefur einn topp er talað um ?

A

Einkryppudreifingu (e. unimodal).

48
Q

Ef dreifingin hefur tvo toppa er talað um?

A

Tvíkryppudreifingu (e. bimodal).

49
Q

Ef dreifing hefur fleiri en tvo toppa er talað um?

A

Fjölkryppudreifingu (e. multimodal).

50
Q

Hvað eru útlagar?

A

Útlagar eru mæligildi sem eru mjög ólík öðrum mæligildum í sama gagnasafni.

51
Q

Fyrir hvað er kassarit notað?

A

Kassarit er notað til að skoða staðsetningu og dreifingu mælinga. Þau endurspegla gögnin vel, sýna glöggt hvort dreifingin er samhverf eða skekkt og eru auk þess góð til að bera kennsl á útlaga. Kassarit má nota hvort heldur til að skoða dreifingu einnar talnabreytu sem og að kanna samband talnabreytu og flokkabreytu.

52
Q

Hvernig er Kassarit (Boxplot)?

A

Kassarit samanstendur af kassa og tveimur línum sem ganga út frá endum kassans. Þessar línur eru oft kallaðar skegg (e. whiskers).

Kassinn má liggja (láréttur) eða standa (lóðréttur) en í þessari bók látum við kassana standa.

53
Q

Hvernig er 1.5 ∗ IQR reglan fyrir útlaga?

A

Byrjum á að reikna út fjarlægð mælingarinnar sem sker sig úr frá næsta fjórðungamarki.
Þessi fjarlægð er síðan borin saman við fjórðungaspönnina . Ef fjarlægð mæligildisins frá næsta fjórðungamarki er meiri en 1.5 ∗IQR er litið á mælinguna sem útlaga.

54
Q

Hvað eru breytt kassarit (e. modified boxplot) ?

A

Mörg tölfræðiforrit nota 1.5 ∗ IQR regluna þegar teiknuð eru kassarit og eru þau oft kölluð breytt kassarit (e. modified boxplot).

55
Q

Hvenær notum við punktarit (e. scatter plot)?

A

Við notum punktarit (e. scatter plot) til að skoða samband milli tveggja talnabreyta. Gildi annarrar breytunnar eru á y-ásnum (lóðréttur) og hinnar á x-ásnum (láréttur). Þegar önnur breytan er skýribreyta og hin er svarbreyta er svarbreytan alltaf á y-ásnum og skýribreytan á x-ásnum.