Tilastojen käyttö Flashcards
(37 cards)
1
Q
Mikä on tilastotiede perinteisen määrittelyn mukaan?
A
- kokemusperäisten tietojen keräämistä, eisttämistä, analysoimista ja johtopäätösten tekoa käsittelevä tiede.
- ongelmat ratkaistaan numeerisiin tai kvantitatiivisin havaintoaineistoihin pohjautuen
- Teoreettinen tilastotiede
- kehittää matemaattisia malleja realimaailman ilmiöihin liittyvien tietojen tarkastelemiseksi - Soveltava tilastotiede
- käyttää teoreettisen tilastotieteen kehittämiä malleja reaalimaalman ilmiöiden kuvailemiseen ja ongelmien ratkaisemiseen
2
Q
Tilastotieteen historiaa?
A
- sai alkunsa keski-euroopassa 1500-luvulla –> ilmestyivät ensimmäiset eri valtioiden oloja kuvaavat teokset –> sis. tietoja väestö. ja verotusoloista, mutta niukasti numerotietoja
- vähitelleen tietomateriaalia kaupallisiin tarpeisiin
- uhkapelien ongelmat vaikuttaneet merkittävästi –> todennäköisyyslaskenta
- keskiaikainen yhteiskuntajärjestyksen hajoaminen –> Euroopan johtavien valtioiden talous kehittyi rahataloudeksi –> tilastotieteen kehitys 1600-luvulla (poliittinen aritmetiikka)
- laajeni oleellisesti 1800-luvulla –> luonnontieteissa sekä yhteiskunta- ja käyttäytymistieteissä alettiin kiinnostua tilastollisista menetelmistä –> pohja perinnöllisyystieteelle
- 1900-luvulla matemaattinen tilastotiede –> teknisten apuvälineiden mahdollisti tilastollisen menetelmien yleistymisen
3
Q
Kyselytytkimukset?
A
- selvitetään ihmisten mielipiteitä, asenteita ja tottumuksia
- voidaan selvittää, miten ihmiset kokevat jonkin asian tai mitä he ajattelevat ilmiöstä
- yleistäminen mahdollista, mikäli vastaajajoukko on ikään kuin pienoismalli kaikista suomalaisista
4
Q
Kokeelliset tutkimukset?
A
- käytetään koeasetelmaa, joss olosuhteita muutetaan tahallisesti –> tutkitaan erik äsittelyjen, menetelmien tai muiden olosuhteiden vaikutusta tutkittaviin kohteisiin
- koeyksiköt jaetaan koeryhmään ja vertailuryhmään
- -> taustamuuttujien eliminoimiseksi vertailtavien ryhmien oltava muilta ominaisuuksiltaan samankaltaisia
- tulosten yleistettävyyttä ja luotettavuutta arvioidaan tilastollisin menetelmin
5
Q
Laaduntarkkailu?
A
- Monille tuotteille tietyt standardein määritellyt laatuvaatimukset –> mahdotonta tutkia kaikki valmistetut tuotteet
- tuotannosta tukitaan osa ja sen perusteella tehdään johtopäätöksiä koskien koko tuotantoa
- tulosteen perusteella tehdään johtopäätös koko tuotannosta
- oleelline kysymys on myös se, että kuinka suuri osa tuotteista on tukittava, jotta laatu voidaan taata tietyllä varmuudella
6
Q
Havainnointitutkimukset?
A
- havainnoi tutkittava kohteen tilan tai tapahtumien kulun, mutta ei puutu siihen
- käytetään tilanteissa, joissa tilanteeseen tai olosuhteisiin ei voida tai ei ole mielekästä vaikuttaa
- vertailtavat ryhmät on muodostettava eri tavoi kuin kokeellisissa tutkimuksessa –> esim. identtiset kaksoset, jotka ovat perimmältään samankaltaisia
7
Q
Tutkimuksen vaiheet pääpiirteittäin?
A
- tutkimuksen suunnittelu
- tutkimusaineiston hankinta
- aineiston esittäminen ja tiivistäminen
- matemaattisten mallien soveltaminen
- johtopäätösten tekeminen
8
Q
Miten tutkimustulosten käyttökelpoisuus muodostuu?
A
- saadaanko vastaus esitettyyn tutkimusongelmaan
- mikä on tulosten merkitsevyys todellisuudessa
- miten luotettavia tulokset ovat
- —> validiteetti
- —> reliabiliteetti
9
Q
Validiteetti?
A
- tarkoittaa, tutkimuksen pätevyyttä
- -> aineiston tehdyt johtopäätökset ovat oikeat ja vastaavat tutkimusongelmaa
- Sisäinen validiteetti
- tutkimuksessa tulokset johtuvat tutkimusasetelmasta eikä ulkoisia häiriötekijöitä esiinny
- tärkeässä roolissa käytetyt mittarit tai muuttujat - Ulkoinen validiteetti
- tulokset ovat siirrettävissä tai yleistettävissä
- perusedellytys on, että otos edustaa perusjoukkoa
- otantavirheiden lisäksi, koeasetelma voi heikentää ulkoista validiteettia –> esim. ihmisten käyttäytyminen ja tuntemukset saattavat muuttua, kun he saavat tietää olevansa seurannan kohteina
10
Q
Reliabiliteetti?
A
- analyysin johdonmukaisuutta ja mittaustulosten pysyvyyttä
- muuttujien arvoissa esiintyvät vaihtelut peräisin aidoista eroista, eivätkä sattumasta
- tutkimuksen rinnaikkaistutkimuksessa tai tutkimus toistettaessa saadaan kutakuinkin samat tulokset
11
Q
Perusjoukko?
A
- populaatio, tutkimuskohteiden muodostama joukko eli kohdejoukko
- määrittäminen tai rajaaminen on tilastollisen tutkimuksen enismmäisiä toimenpiteitä
12
Q
Tilastoyksikkö?
A
- havaintoyksikkö on yksittäinen tutkimuksen kohde
- kohdejoukon alkio
13
Q
Muuttuja?
A
- se ominaisuus, jota tukitaan
14
Q
Havaintoaineisto?
A
- muodostavat tilastoyksiköistä mitatut muuttujien arvot
15
Q
Kvantitatiivinen tieto?
A
- määrällinen tieto –> vastaa määrää tarkoittavaan kysymykseen
- ilmaistaan numeerisesti
16
Q
Kvalitatiivinen tieto?
A
- laadullinen tieto –> vastaa nimitystä tai laatua tarkoittavaan kysymykseen
- voidaan ilmaista kielellisesti tai numeerisesti
17
Q
Jatkuva muuttuja?
A
- jos se voi periaatteessa saada minkä tahansa reaalilukuarvon tietyllä välillä –> esim. pituus
18
Q
Epäjatkuva muuttuja?
A
- diskreetti, jos se voi saada vai äärellisen määrän eri arvoja –> esim. lukumäärä
- myös laatua mittaavat muuttujat, esim. sukupuoli tai kieli
19
Q
Diktonominen muuttuja?
A
- jos se saa kaksi arvoa
- ominaisuus on olemassa kyseisellä tilastoyksiköllä tai sitä ei ole olemassa –> esim. henkilö harrastaa avantounitia tai ei harrasta
20
Q
Muuttujien mitta-asteikot?
A
- määrittely on tarpeen, koska suoritettavat tilastolliset toimenpiteet määräytyvät, mitta-asteikon mukaan
Laadulliset muuttujat:
- luokitteluasteikko
- järjestysasteikko
Määrälliset muuttujat :
- välimatka-asteikko
- suhdeasteikko
21
Q
Luokitteluasteikko?
A
- laatueroasteikko
- muuttujien arvot voidaan erotella toisistaan laadullisesti ilmoittamalla vain ryhmä tai luokka, johon havainto kuuluu
- arvoilla ei ole mitään yksiselitteistä järjestystä –> esim. mies = 1 ja nainen = 2
- luokkien tai koodien järjestyksen vaihtaminen ei vaikuta aineistoin käsittelyyn tai saataviin tuloksiin
- lukumäärien ja niistä laskettujen prosenttiosuuksien laskeminen ovat ainoat sallitut laskutoimenpiteet
22
Q
Järjestysasteikko?
A
- ordinaaliasteikko
- muuttujan arvoluokat voidaan panna mitatun ominaisuuden mukaan järjestykseen –> esim. hyvä, kiitettävä, tyydyttävä –> ei voida sanoa, kunka paljon kiitettävä on parempi kuin hyvä
23
Q
Välimatka-asteikko?
A
- intervalliasteikko
- muuttuja mittaa määrää
- järjestyksen lisäksi arvojen erotus voidaan laskea
- “kuinka paljon enemmän”
- esim. lämpötila celsius tai fahrcenheit asteina –> lämpötilaerot voidaan laskea, mutta lämpötilojen suhde ei ole mielekäs
24
Q
Suhdeasteikko?
A
- suhdelukuasteikko
- välimatkojen laskemisen lisäksi mahdollista laskea muuttujan arvojen suhteet
25
Mittarin validiteetti?
- tarkoitetaan pätevyyttä, eli sen hyvyyttä mitata juuri sitä, mitä sen on tarkoitus mitata
- esim. kyselytutkimuksia laadittaessa on varmistettava, että kysymyksellä mitataan juuri tarkoitettua asiaa ja kysymys merkitsee kaikille vastaajille samaa
- kultturierot ja ympäristön muutokset voivat aiheuttaa sen, ettei sama mittari ole validi eri ympäristöissä tai eri ajankohtina
- esim. kuukausiansiot ei ole validi mittari varakkuuden mittaamiseen
26
Ennustevaliditeetti?
- kun muuttujalla on ennustusarvoa --> esim. ikä
27
Mittarin reliabiliteetti?
- mittarin toimintavarmuutta tai pysyvyyttä
- ei ole herkkä ulkopupolisten tekijöiden vaikutuksille eikä anna sattumanvaraisia tuloksia
- toistomittaukset antavat kutakuinkin saman tuloksen
- esim. 2% kutistunut mittanauha on reliaabeli, muttei validi
28
Tavoiteperusjoukko?
- muodostavat kaikki tilastoyksiköt, joista ollaan kiinnostuneita
29
Kehikkoperusjoukko?
- muodostavat ne tilastoyksiköt, jotka voidaan tutkia
| - voi olla ali- tai ylipeittoa tavoiteperusjoukkoon nähden
30
Kokonaistutkimus?
- jos tietoa pyritään keräämään kaikista kohdejoukon havaintoyksiköistä
31
Yleisimmin käytetyt otantamenetelmät?
- yksinkertainen satunnaisotanta
- systemaattinen otanta
- ositettu otanta
- ryväsotanta
32
Yksinkertainen satunnaisotanta?
- arpomismenetelmä, jossa jokaisella perusjoukon yksiköllä on sama mahdollisuus tulla poimituksi
33
Systemaattinen otanta?
- yksiköitä ei tarvitse numeroida, mutta niiden on oltava jollain lailla jonossa --> esim. rekisteri, asiakasjono yms.
- jonosta poimitaan havaintoyksiköt tasavälisesti
- poiminta nopeampaa kuin satunnaisotannassa
- ei ole käyttökelpoinen, jos esiintyy jaksollisuutta
k = N/n
```
N = perusjoukon alkioiden lukumäärä
n = otokseen poimittavat alkioiden määrä
k = poimintaväli
```
34
Ositettu otanta?
- perusjoukko jaetaan jonkin tunnetun ominaisuuden mukaan ryhmiin, ositteiksi --> esim. ammatti, sukupuoli
- etuna, että jokaisesta ositteista tulee varmasti alkioita otokseen
- otokset valitaan yksinkertaisella satunnaisotannalla tai systemaattisella otannalla
- eri ositteista otokseen tulevien alkioiden lukumäärä määritetään tilannekohtaisesti
- -> suhteellinen kiintiöinti, jossa kustakin ositteista valitaan alkioita otokseen samassa suhteessa, kuin niitä on perusjoukossa
- -> optimaalinen kiintiöinti, jossa otetaan huomioon ositteen koon lisäksi ositteen havaintoyksiköiden hajonta
35
Ryväsotanta?
- Ryväsotannassa muodostetaan perusjoukon alkioista ensin osajoukkoja eli ryppäitä, jonkin ominaisuuden mukaan --> esim. koulut tai koululuokat
- -> koulujen tai luokkien oppilaat tutkitaan, joko kaikki tai heistä suoritetaan vielä otanta
36
Kato?
- kaikkia tilastoyksiköitä ei tavoiteta tai tietoa muusta syystä saada
37
Näyte?
- kun perusjoukosta valitaan alkioita tutkimukseen tavoilla, jotka eivät täytä otannan ehtoja
- kun valinnassa käytetään harkintaa
- ei voida tehdä luotettavia johtopäätöksiä koko perusjoukkoa koskien