Tilastojen käyttö Flashcards Preview

Tilastotiede > Tilastojen käyttö > Flashcards

Flashcards in Tilastojen käyttö Deck (37):
1

Mikä on tilastotiede perinteisen määrittelyn mukaan?

- kokemusperäisten tietojen keräämistä, eisttämistä, analysoimista ja johtopäätösten tekoa käsittelevä tiede.
- ongelmat ratkaistaan numeerisiin tai kvantitatiivisin havaintoaineistoihin pohjautuen

1. Teoreettinen tilastotiede
- kehittää matemaattisia malleja realimaailman ilmiöihin liittyvien tietojen tarkastelemiseksi

2. Soveltava tilastotiede
- käyttää teoreettisen tilastotieteen kehittämiä malleja reaalimaalman ilmiöiden kuvailemiseen ja ongelmien ratkaisemiseen

2

Tilastotieteen historiaa?

- sai alkunsa keski-euroopassa 1500-luvulla --> ilmestyivät ensimmäiset eri valtioiden oloja kuvaavat teokset --> sis. tietoja väestö. ja verotusoloista, mutta niukasti numerotietoja

- vähitelleen tietomateriaalia kaupallisiin tarpeisiin

- uhkapelien ongelmat vaikuttaneet merkittävästi --> todennäköisyyslaskenta

- keskiaikainen yhteiskuntajärjestyksen hajoaminen --> Euroopan johtavien valtioiden talous kehittyi rahataloudeksi --> tilastotieteen kehitys 1600-luvulla (poliittinen aritmetiikka)

- laajeni oleellisesti 1800-luvulla --> luonnontieteissa sekä yhteiskunta- ja käyttäytymistieteissä alettiin kiinnostua tilastollisista menetelmistä --> pohja perinnöllisyystieteelle

- 1900-luvulla matemaattinen tilastotiede --> teknisten apuvälineiden mahdollisti tilastollisen menetelmien yleistymisen

3

Kyselytytkimukset?

- selvitetään ihmisten mielipiteitä, asenteita ja tottumuksia
- voidaan selvittää, miten ihmiset kokevat jonkin asian tai mitä he ajattelevat ilmiöstä
- yleistäminen mahdollista, mikäli vastaajajoukko on ikään kuin pienoismalli kaikista suomalaisista

4

Kokeelliset tutkimukset?

- käytetään koeasetelmaa, joss olosuhteita muutetaan tahallisesti --> tutkitaan erik äsittelyjen, menetelmien tai muiden olosuhteiden vaikutusta tutkittaviin kohteisiin
- koeyksiköt jaetaan koeryhmään ja vertailuryhmään
--> taustamuuttujien eliminoimiseksi vertailtavien ryhmien oltava muilta ominaisuuksiltaan samankaltaisia
- tulosten yleistettävyyttä ja luotettavuutta arvioidaan tilastollisin menetelmin

5

Laaduntarkkailu?

- Monille tuotteille tietyt standardein määritellyt laatuvaatimukset --> mahdotonta tutkia kaikki valmistetut tuotteet
- tuotannosta tukitaan osa ja sen perusteella tehdään johtopäätöksiä koskien koko tuotantoa
- tulosteen perusteella tehdään johtopäätös koko tuotannosta
- oleelline kysymys on myös se, että kuinka suuri osa tuotteista on tukittava, jotta laatu voidaan taata tietyllä varmuudella

6

Havainnointitutkimukset?

- havainnoi tutkittava kohteen tilan tai tapahtumien kulun, mutta ei puutu siihen
- käytetään tilanteissa, joissa tilanteeseen tai olosuhteisiin ei voida tai ei ole mielekästä vaikuttaa
- vertailtavat ryhmät on muodostettava eri tavoi kuin kokeellisissa tutkimuksessa --> esim. identtiset kaksoset, jotka ovat perimmältään samankaltaisia

7

Tutkimuksen vaiheet pääpiirteittäin?

- tutkimuksen suunnittelu
- tutkimusaineiston hankinta
- aineiston esittäminen ja tiivistäminen
- matemaattisten mallien soveltaminen
- johtopäätösten tekeminen

8

Miten tutkimustulosten käyttökelpoisuus muodostuu?

- saadaanko vastaus esitettyyn tutkimusongelmaan
- mikä on tulosten merkitsevyys todellisuudessa
- miten luotettavia tulokset ovat
----> validiteetti
----> reliabiliteetti

9

Validiteetti?

- tarkoittaa, tutkimuksen pätevyyttä
--> aineiston tehdyt johtopäätökset ovat oikeat ja vastaavat tutkimusongelmaa

1. Sisäinen validiteetti
- tutkimuksessa tulokset johtuvat tutkimusasetelmasta eikä ulkoisia häiriötekijöitä esiinny
- tärkeässä roolissa käytetyt mittarit tai muuttujat

2. Ulkoinen validiteetti
- tulokset ovat siirrettävissä tai yleistettävissä
- perusedellytys on, että otos edustaa perusjoukkoa
- otantavirheiden lisäksi, koeasetelma voi heikentää ulkoista validiteettia --> esim. ihmisten käyttäytyminen ja tuntemukset saattavat muuttua, kun he saavat tietää olevansa seurannan kohteina

10

Reliabiliteetti?

- analyysin johdonmukaisuutta ja mittaustulosten pysyvyyttä
- muuttujien arvoissa esiintyvät vaihtelut peräisin aidoista eroista, eivätkä sattumasta
- tutkimuksen rinnaikkaistutkimuksessa tai tutkimus toistettaessa saadaan kutakuinkin samat tulokset

11

Perusjoukko?

- populaatio, tutkimuskohteiden muodostama joukko eli kohdejoukko
- määrittäminen tai rajaaminen on tilastollisen tutkimuksen enismmäisiä toimenpiteitä

12

Tilastoyksikkö?

- havaintoyksikkö on yksittäinen tutkimuksen kohde
- kohdejoukon alkio

13

Muuttuja?

- se ominaisuus, jota tukitaan

14

Havaintoaineisto?

- muodostavat tilastoyksiköistä mitatut muuttujien arvot

15

Kvantitatiivinen tieto?

- määrällinen tieto --> vastaa määrää tarkoittavaan kysymykseen
- ilmaistaan numeerisesti

16

Kvalitatiivinen tieto?

- laadullinen tieto --> vastaa nimitystä tai laatua tarkoittavaan kysymykseen
- voidaan ilmaista kielellisesti tai numeerisesti

17

Jatkuva muuttuja?

- jos se voi periaatteessa saada minkä tahansa reaalilukuarvon tietyllä välillä --> esim. pituus

18

Epäjatkuva muuttuja?

- diskreetti, jos se voi saada vai äärellisen määrän eri arvoja --> esim. lukumäärä
- myös laatua mittaavat muuttujat, esim. sukupuoli tai kieli

19

Diktonominen muuttuja?

- jos se saa kaksi arvoa
- ominaisuus on olemassa kyseisellä tilastoyksiköllä tai sitä ei ole olemassa --> esim. henkilö harrastaa avantounitia tai ei harrasta

20

Muuttujien mitta-asteikot?

- määrittely on tarpeen, koska suoritettavat tilastolliset toimenpiteet määräytyvät, mitta-asteikon mukaan

Laadulliset muuttujat:
- luokitteluasteikko
- järjestysasteikko

Määrälliset muuttujat :
- välimatka-asteikko
- suhdeasteikko

21

Luokitteluasteikko?

- laatueroasteikko
- muuttujien arvot voidaan erotella toisistaan laadullisesti ilmoittamalla vain ryhmä tai luokka, johon havainto kuuluu
- arvoilla ei ole mitään yksiselitteistä järjestystä --> esim. mies = 1 ja nainen = 2
- luokkien tai koodien järjestyksen vaihtaminen ei vaikuta aineistoin käsittelyyn tai saataviin tuloksiin
- lukumäärien ja niistä laskettujen prosenttiosuuksien laskeminen ovat ainoat sallitut laskutoimenpiteet

22

Järjestysasteikko?

- ordinaaliasteikko
- muuttujan arvoluokat voidaan panna mitatun ominaisuuden mukaan järjestykseen --> esim. hyvä, kiitettävä, tyydyttävä --> ei voida sanoa, kunka paljon kiitettävä on parempi kuin hyvä

23

Välimatka-asteikko?

- intervalliasteikko
- muuttuja mittaa määrää
- järjestyksen lisäksi arvojen erotus voidaan laskea
- "kuinka paljon enemmän"
- - esim. lämpötila celsius tai fahrcenheit asteina --> lämpötilaerot voidaan laskea, mutta lämpötilojen suhde ei ole mielekäs

24

Suhdeasteikko?

- suhdelukuasteikko
- välimatkojen laskemisen lisäksi mahdollista laskea muuttujan arvojen suhteet

25

Mittarin validiteetti?

- tarkoitetaan pätevyyttä, eli sen hyvyyttä mitata juuri sitä, mitä sen on tarkoitus mitata
- esim. kyselytutkimuksia laadittaessa on varmistettava, että kysymyksellä mitataan juuri tarkoitettua asiaa ja kysymys merkitsee kaikille vastaajille samaa
- kultturierot ja ympäristön muutokset voivat aiheuttaa sen, ettei sama mittari ole validi eri ympäristöissä tai eri ajankohtina
- esim. kuukausiansiot ei ole validi mittari varakkuuden mittaamiseen

26

Ennustevaliditeetti?

- kun muuttujalla on ennustusarvoa --> esim. ikä

27

Mittarin reliabiliteetti?

- mittarin toimintavarmuutta tai pysyvyyttä
- ei ole herkkä ulkopupolisten tekijöiden vaikutuksille eikä anna sattumanvaraisia tuloksia
- toistomittaukset antavat kutakuinkin saman tuloksen
- esim. 2% kutistunut mittanauha on reliaabeli, muttei validi

28

Tavoiteperusjoukko?

- muodostavat kaikki tilastoyksiköt, joista ollaan kiinnostuneita

29

Kehikkoperusjoukko?

- muodostavat ne tilastoyksiköt, jotka voidaan tutkia
- voi olla ali- tai ylipeittoa tavoiteperusjoukkoon nähden

30

Kokonaistutkimus?

- jos tietoa pyritään keräämään kaikista kohdejoukon havaintoyksiköistä

31

Yleisimmin käytetyt otantamenetelmät?

- yksinkertainen satunnaisotanta
- systemaattinen otanta
- ositettu otanta
- ryväsotanta

32

Yksinkertainen satunnaisotanta?

- arpomismenetelmä, jossa jokaisella perusjoukon yksiköllä on sama mahdollisuus tulla poimituksi

33

Systemaattinen otanta?

- yksiköitä ei tarvitse numeroida, mutta niiden on oltava jollain lailla jonossa --> esim. rekisteri, asiakasjono yms.
- jonosta poimitaan havaintoyksiköt tasavälisesti
- poiminta nopeampaa kuin satunnaisotannassa
- ei ole käyttökelpoinen, jos esiintyy jaksollisuutta

k = N/n

N = perusjoukon alkioiden lukumäärä
n = otokseen poimittavat alkioiden määrä
k = poimintaväli

34

Ositettu otanta?

- perusjoukko jaetaan jonkin tunnetun ominaisuuden mukaan ryhmiin, ositteiksi --> esim. ammatti, sukupuoli
- etuna, että jokaisesta ositteista tulee varmasti alkioita otokseen
- otokset valitaan yksinkertaisella satunnaisotannalla tai systemaattisella otannalla

- eri ositteista otokseen tulevien alkioiden lukumäärä määritetään tilannekohtaisesti
--> suhteellinen kiintiöinti, jossa kustakin ositteista valitaan alkioita otokseen samassa suhteessa, kuin niitä on perusjoukossa
--> optimaalinen kiintiöinti, jossa otetaan huomioon ositteen koon lisäksi ositteen havaintoyksiköiden hajonta

35

Ryväsotanta?

- Ryväsotannassa muodostetaan perusjoukon alkioista ensin osajoukkoja eli ryppäitä, jonkin ominaisuuden mukaan --> esim. koulut tai koululuokat
--> koulujen tai luokkien oppilaat tutkitaan, joko kaikki tai heistä suoritetaan vielä otanta

36

Kato?

- kaikkia tilastoyksiköitä ei tavoiteta tai tietoa muusta syystä saada

37

Näyte?

- kun perusjoukosta valitaan alkioita tutkimukseen tavoilla, jotka eivät täytä otannan ehtoja
- kun valinnassa käytetään harkintaa
- ei voida tehdä luotettavia johtopäätöksiä koko perusjoukkoa koskien