Stat felvételi Flashcards

Question

nem válaszolási hiba más néven?

Answer 1

nem válaszolók torzítása (fellép)

Answer 2

A nem válaszolók erősen különbözhetnek a válaszolóktól. Nagyarányú válaszhiánynál figyeljünk oda a nem válaszolók torzítására! ok: kevésbé hajlamosak visszaküldeni a kérdőíveket az alacsony és a magas jövedelműek, tehát a válaszolók között túlreprezentált a középosztály. másik példa : a nem válaszolók torzításának problémája személyes megkérdezés során is fennáll. Azok, akik a kérdező telefonhívásakor nem voltak otthon, meglehetősen különbözhetnek az otthon talált emberektől – például munkaidejüket, családi kötöttségeiket, társadalmi hátterüket tekintve, és így attitűdjeikben is

Answer 3

1, véletlen mintavételi eljárások =valószínűségi =a populáció minden tagjának egyforma esélye van a mintába való bekerülésre. a véletlenszerűséget objektív módon kell biztosítani -véletlenszám generálás pl. erre eszköz 2, nem véletlen mintavételi eljárások itt nincs véletlenszerűség abban, hogy mik/ kik alkotják a mintát

Answer 4

független azonos eloszlású (mv) egyszerű véletlen rétegzett csoportos +többlépcsős mintavétel

Answer 5

független jelentése= a mintába kerülő elemeket visszatevéssel választják ki azonos eloszlás jelentése=az elemek adatai nem változnak idő közben problémát okozhat akkor, ha valamilyen szélsőséges elem többször bekerül a mintába.

Answer 6

a populáció minden eleme egyenlő valószínűséggel kerülhet be, továbbá ezen eljárás alkalmazásakor a sokaságot nem osztjuk fel semmilyen alcsoportokra. a felesleges duplikációk nélkül hasznosabbnak tűnik, de vannak olyan esetek amikben nem tudom garantálni, hogy kivegyem az illetőt/elemet =és ugyanúgy kell vele dolgozni pl: ha kockával dobok ötöst akkor nem tudom leszedni a kocka 5-ös oldalát utána A FAE módszer került előtérbe, mert egyszerűbb vele számolni.

Answer 7

**akkor indokolt alkalmazása ha a populáció jelentősen inhomogén** ha tudom, hogy vannak különböző részsokaságok akkor a mintavétel is úgy zajlik majd, hogy a különböző rétegekből egyformán veszek elemszámot pl: fiúkból veszek 5 elemű mintát, ha ők pl a kar negyedét teszik ki, lányokból egy 15 elemű mintát pedig minden réteg megfelelően képviselve van.

Answer 8

ez pont **abból indul ki, hogy a részsokaságok között nincs nagy különbség** egyforma részsokaságok közül kiválasztok egyet és azt megfigyelem

Answer 9

kiválasztok egy csoportot és azon belül is megvizsgálok egy csoportot -kérdőívekkel foglalkozó szervezetek többsége ezt az eljárást alkalmazza

Answer 10

pl: 4 régióra bontom az usát régiókon belül összecsoportosítom a hasonló lakosságszámú településeket -véletlenül kiválasztok párat -véletlenül kiválasztok pár választókerületet -véletlenül kiválasztok pár szavazókörzetet a választókerületeken belül -véletlenszerűen háztartások is kiválasztva (ezután is megvan adva általában hogy x éven felüli nőt vagy férfit kell megkérdezni ha az nincs otthon akkor kit ) (kérdezőbiztos ne válogathasson kedvére)

Answer 11

-kvótákon alapuló -koncentrált -hólabda -önkényes

Answer 12

**előre adott a minta bizonyos ismérvek szerinti összetétele**, ezen belül szabadon választhatnak vannak kvóták pl: 50% a válaszadóknak férfi 50% nő 60% fehér 40% fekete 50% városi 50% vidéki ezen belül hogy kit kérdez meg a kérdezőbiztos az egyéni döntés

Answer 13

a sokaságban van néhány elem, melynek nagyobb a befolyása a sokasági jellemzőre, mint a többi elemnek. Ilyen esetben a nagyobb befolyással rendelkező elemeket biztosan beválasztjuk a mintába, tehát nem beszélhetünk véletlen kiválasztásról. (ha inflációs rátát számolok akkor inkább egy kiló kenyér árváltozását figyeljem meg és ne a barbie babák árváltozását)

Answer 14

elindítok egy kérdőívet, de nem én gondoskodok róla, hogy ez kikhez fog kijutni, hanem több másik végzi a további adatfelvételt pl: droghasználóknál felmérés

Answer 15

kvázi szakértő eldönti, hogy kiket vesz bele a mintába

Answer 16

valószínűségi mintavételi módszerek

Answer 17

-miféle emberekhez sétál oda szívesebben a kérdező -ki fog elsétálni egy adott napszakban egy adott utcán (nyugdíjasok, diákok, munkanélküliek?) -szegényebb környéken van a kérdező, gazdagabb környéken mind torzító hatással járhat

Answer 18

Valamelyest korrigálni lehet ezt úgy, hogy nagyobb súlyt rendelnek az elértek közül a csak nehezen elérhető személyekhez.

Answer 19

utólagos súlyozás !!! (szakszó) -objektív számolási eljárás kisebb torzításokat lehet vele kompenzálni pl: az iskolázottak válaszainak kisebb súlyt adok -kisebb súllyal veszem figyelembe őket

Answer 20

(A megítélés és a választás azonban általában torzít, míg a véletlen pártatlan. Ezért működnek jobban a valószínűségi eljárások, mint a megítélésen alapulók.) Ahhoz, hogy a torzítást minimalizáljuk, pártatlan és objektív valószínűségi eljárásokat kell alkalmaznunk a minta kiválasztásakor.

Answer 21

1.vannak emberek akik kérdőívben azt válaszolják hogy xy dolgot csinálnak, de egyébként nagy valószínűséggel nem fognak (pl: negatív megítélés alá esik ha valaki nem szavazik, nem akarják ezt beismerni az emberek) -ez torzítja az eredményeket -ki kell szűrni a komolytalan válaszadókat választások esetén meg lehet kérdezni: -legutóbb szavazott a választásokon? -hol tervez szavazni idén --ha nem tud helyszínt megnevezni valaki az már kevésbé komoly szándékra utal valószínű nem szavazók kiszűrése növeli az előrejelzés pontosságát

Answer 22

úgy kell megfogalmazni a kérdéseket hogy a lehető legkisebb legyen a határozatlanok aránya pl: szavazás -nem azt kérdezik meg kire fogok szavazni április 11én hanem: ha ma lenne a választás kire szavaznék valamennyi bizonytalan ezután is marad--- ezeknek a döntését meg kell tippelnie a közvéleménykutatónak teheti ezt az alapján, hogy további kérdéseket tesz fel politikai attitűdjéről az adott embernek a nagy előrejelzési hibáknak könnyen lehet magyarázója a bizonytalanok száma

Answer 23

a kérdezés torzítása kapott válaszokat befolyásolhatja: -kérdés megfogalmazása -kérdező attitűdje -kérdező hangneme pl: 48-as elnökválasztás -jelöltek sorrendjének megváltoztatása 5 %-kal módosította a válaszokat egységesíteni kell a kérdezés folyamatát amennyire csak lehetséges

Answer 24

nem kérdéses dolog aránya a mintában= valós arány a mintában (amire kíváncsiak vagyunk) + véletlen hiba becslés= paraméter + torzítás + véletlen hiba (bonyibb eseteknél) vagy becslés = paraméter + véletlen hiba

Answer 25

mintavételi hiba

Answer 26

abból ered, hogy a kutatásban alkalmazott minta nem tükrözi teljes mértékben a reprezentálni kívánt alapsokaságot. ‖ abból fakad, hogy a minta csak egy része az egésznek.

Answer 27

„nem mintavételi hibának‖ hívjuk – a hiba forrása valami más, például a kimaradt megkérdezendők, a nem válaszolók. nem azért más az eredmény mert mintát használok és nem az egész sokaság vizsgálom meg

Answer 28

becslés: sokasági jellemző közelítő értékének előállítása a minta alapján a minta alapján akarok következtetni a sokaságra vonatkozóan ez egy érezhetően nehéz feladat-egy közelítő értéket viszont megtudhatunk megkülönböztetünk: 1.: pontbecslést-egyetlen értéket határozunk meg 2.: intervallumbecslést- egy olyan intervallumot meghatározunk, melyben nagy valószínűséggel benne van a vizsgált jellemző

Answer 29

Megmutatja, hogy **a valóságtól mennyire messze szoktak lenni a becslések.** Standard hiba **nagysága egyenesen arányos a szórással** ami tök logikus mit mutat meg a szórás? Hogy az adataim mennyire különböznek egymástól és minél inkább különbözőek ezek az adatok annál nehezebb megbecsülni vmit pl: ha a 10 legnagyobb népességű város alapján akarok egy magyar átlagváros népességet megbecsülni, akkor logikus hogy Budapest lakosai nagyon pontatlanná fogják tenni az eredményt a maguk millióival Ezt a hibát akarom minimalizálni ugyebár. **minél nagyobb az elemszám, annál kisebb hibát véthetünk.**

Answer 30

=valóságtól mennyire szoktak messze lenni a becslések **a mintaátlagok szóródása a sokasági átlag körül**

Answer 31

**egy mintától nem várhatom el, hogy jellemezze tökéletesen a sokaságot, de a torzítatlanságot elvárom.** Ez mit jelent? **Mintajellemzők átlaga a sokasági jellemző**---ezt úgy tudjuk leellenőrizni, hogy veszek egy pl 180 adatot tartalmazó halmazból és az összes létező pl. 10 darabos mintát megnézem, hogy mennyi az átlaguk és ha azon mintajellemzők átlagosan megegyeznek a sokasági átlaggal -akkor jó munkát végeztünk nem egy eseti mintaátlagnak kell megegyeznie vele, hanem az összes mintán vett mintaátlagok átlagának Tehát jó esetben a „mintaátlagok átlaga” megegyezik a sokasági átlaggal

Answer 32

standard hiba

Answer 33

részben csak megegyezik nagyjából de van standard hiba

Answer 34

(darabszám st hibája / minta nagysága ) * 100%

Answer 35

16/400 *100 = 4 % (de ez az utolsó dolog amit élőben elrontanék)

Answer 36

válasz: a. A piros golyók mintabeli százalékarányának várható értéke megegyezik a piros golyók alapsokaságbeli százalékarányával. b. Ha több golyót húzunk, akkor a piros golyók számának standard hibája a mintában megnő, a piros golyók százalékarányának standard hibája viszont lecsökken.

Answer 37

Valójában az új-mexikói és a texasi közvéleménykutatás lényegében egyformán pontosnak várható. Képzeljük el, hogy vegyelemzéshez egy csepp mintát veszünk egy folyadékból. Ha a folyadék jól el van keveredve, akkor a csepp kémiai összetétele tükrözi az egész üveg összetételét, és igazán nem számít, hogy egy kis üvegcséből vagy egy nagy kancsóból vettük a mintát. A vegyész mit sem törődik azzal, hogy a csepp az oldatnak 1%-a vagy 0,01%-a.

Answer 38

Ha visszatevés nélkül húzunk, kicsivel csökken a doboz, és így enyhén lecsökken a szóródás. Visszatevés nélküli húzásoknál ezért picivel kisebb a standard hiba. Visszatevéses esetekben valamivel nagyobb.

Answer 39

gyök alatt húzások száma * szórás egyébként: **dobozmodell** alapján **férfiak 1-esek **---0,6 arány **nők 0-ák** ---0,4 ekkor szórás: gyök alatt 0,6 * 0,4 !!!!!!!!!!!!!!!!

Answer 40

-ha vissztevéses húzás van akkor nem -ha visszatevés nélküli akkor lehet attól függ hogy pl 10 milliós alapsokaságból ha veszek egy 10 fős mintát akkor nem kell-standard hibát normál módon számolom ha: pl 10 milliós alapsokaságból a negyede a mintám akkor kell korrekciós szorzó (feltéve: nincs visszatétel)

Answer 41

**gyök alatt minden** 20 ezer (összsokaság) - 5 ezer (minta) / 20 ezer -**1** **GYÖK ALATT és mindig mínusz 1 a vége összsok- minta / összsok-1 **visszatev nélküli standard hiba =korr szorzó * visszatevéses standard hiba**

Answer 42

**a doboz ismeretlen megoszlását a mintában megfigyelt részaránnyal helyettesítik be.** **behelyettesített arányok ---ez alapján megnézzük a szórást és a standard hibát**

Answer 43

Példánkban a 2500 fős mintából 1328 ember volt a képviselőjelölt mellett. Tehát a mintában 1328 / 2500 ≈ 0,53, azaz 53% támogatta őt, 47% volt ellene. Becslésünk az, hogy a dobozban lévő 100 000 cédula 0,53-adrészén áll 1-es, a többi cédulán 0. Ennek alapján a doboz szórását így becsüljük: . A képviselőjelöltet támogató szavazók mintabeli számának standard hibáját tehát (gyök alatt 2500 * 0,5 -re) becsüljük. (0.5 mert: gyök alatt 0.53*gyök alatt 0.47)Ez a szám mutatja az 1328 fő véletlen hibájának valószínű nagyságát. A 2500 fős mintából ez a 25 fő 1%-ot tesz ki. A mintában a támogatók százalékarányának standard hibáját így 1 százalékpontra becsüljük. Ezzel készen vagyunk a standard hiba becslésére szolgáló ún. „bootstrap‖ iieljárás végrehajtásával.

Answer 44

persze ekkor a becslésünk alálőtt pl: -4 st hib azt jelenti pl hogy 68% helyett 72% helyes

Answer 45

**68%**ig biztos hogy a populáció százalékaránya: 77% és 81% közötti (+/- 1 SH) **95%**ig biztos, hogy a populáció százalékaránya: 75% és 83% közötti (+/- 2 SH) **99,7%**ig biztosak lehetünk abban, hogy a populáció százalékaránya: 73% és 85% közötti (+/- 3 SH)

Answer 46

megbízhatósági szint: 95%

Answer 47

Egy szignifikanciapróba azzal a kérdéssel foglalkozik, hogy valóságos-e a megfigyelt eltérés (ez az ellenhipotézis), vagy pusztán véletlen ingadozás (ez a nullhipotézis). Az az alapgondolatuk, hogy ha egy megfigyelt érték túl sok standard hibányira esik a várható értékétől, azt nehéz véletlennel magyarázni.

Answer 48

A százalék egy adott számnak a század részét jelenti, ezzel szemben a százalékpont egységnyi százalék változását jelöl. Például 40 százaléknak a 10 százalékos növekedése 44 százalékot, a 10 százalékpontos növekedése pedig 50 százalékot eredményez.

Answer 49

A nullhipotézis azt az elgondolást fejezi ki, hogy a megfigyelt eltérést (a várható és a megfigyelt érték között) a véletlen okozza. Az ellenhipotézis ennek ellenkezőjét állítja.

Answer 50

A próbastatisztika arra való, hogy mérje, mennyire térnek el **az adatok** a nullhipotézis alapján várható értéktől.

Answer 51

= megfigyelt érték- várható érték __________________________________ standard hiba A z azt mondja meg, hogy a megfigyelt érték hány standard hibányira esik a nullhipotézis alapján kiszámolt várható értéktől.

Answer 52

nem simán kiszámolom megnézem az átlagot és stb

Answer 53

A megfigyelt szignifikanciaszint (P-nek vagy P-értéknek is nevezik) annak a valószínűsége, hogy annyira szélsőséges próbastatisztikát kapunk, mint amilyet megfigyeltünk, vagy még szélsőségesebbet. Kiszámításakor úgy számolunk, mintha a nullhipotézis igaz lenne. Tehát a P nem azt mondja meg, hogy milyen valószínűséggel igaz a nullhipotézis.

Answer 54

Természetesen adódik a kérdés, mennyire kell kicsinek lennie a megfigyelt szignifikanciaszintnek ahhoz, hogy a kutató elvethesse a nullhipotézist. Sok statisztikus 5%-nál húzza meg a határt. * Ha P kisebb 5%-nál, akkor statisztikailag szignifikáns-nak nevezzük az eredményt. Egy másik határvonal is van, 1%-nál. * Ha P kisebb 1%-nál, akkor az eredmény erősen szignifikáns.

Answer 55

* meg kell fogalmaznunk a nullhipotézist; ez egy, az adatokra vonatkozó dobozmodell lesz; * ki kell választanunk egy alkalmas próbastatisztikát – ezzel fogjuk mérni, mennyire térnek el az adatok a nullhipotézis alapján várhatótól; * ki kell számítanunk a megfigyelt szignifikanciaszintet, azaz P-t.

Answer 56

kis minták esetén pl van négy vagy 5 mérésem

Answer 57

Student-görbét akkor használunk, ha * Olyanok az adatok, mintha egy dobozból végeznénk húzásokat. * Nem ismerjük a doboz szórását. * A megfigyelések száma kicsi, emiatt a doboz szórását nem tudjuk igazán pontosan megbecsülni. * A dobozban lévő számokra vonatkozó hisztogram nem sokkal tér el a normálgörbétől. Nagyobb számú megfigyelés esetén (mondjuk 25 fölött) rendszerint a normálgörbét használjuk. Ha ismerjük a doboz szórását és ha a dobozbeli számok a normálgörbét követik, akkor kis mintáknál is használhatjuk a normálgörbét.

Answer 58

Z próba így nézett ki: megfigyelt érték - várható érték ____________________________ standard hiba **standard hiba kiszámítása változik** standard hiba egyébként = gyök alatt:mérések/húzások száma * szórás **itt mi változik: szórás ** szórás = korrigált szórás * szórás korrigált szórás = ha mérések száma = 4 **gyök alatt minden** mérések száma ________________ * szórás mérések száma - 1

Answer 59

igaz magyarázat: Igaz; z=(megfigyelt – várható)/standard hiba; "várható"-t a nullhipotézis alapján számolva.

Answer 60

Két független mennyiség eltérésének standard hibája gyök alatt a^2 + b^2 • a az első mennyiség standard hibája; • b a második mennyiség standard hibája.

Answer 61

arra keressük a választ, hogy két minta alapján kijött értékek közötti eltérés magyarázható-e véletlen ingadozással vagy sem képlet: **(csak alul változik) ** megfigyelt érték - várható érték(régebbi) ___________________ st hiba **(mintaátlagok közötti eltérés!! stb hibája) **

Answer 62

* a két mintaelemszámot, * a két mintaátlagot, * a két minta szórását. A próba két **független, egyszerű véletlen **mintára alkalmazható. Általában hibás eredményt kapunk, ha a képleteket összefüggő mintákra alkalmazzuk. Van kivétel: használhatjuk a z-próbát arra, hogy a kezelt és a kontrollcsoportot egy sorsolt kontrollú kísérletben összehasonlítsuk – még olyankor is, amikor a csoportok összefüggenek

Answer 63

kétmintás

Answer 64

bár a minták nem függetlenek lehet

Answer 65

visszatevéses st hibát kell számítani akkoris ha visszatétel nélkül történt a mintavétel!

Answer 66

nem csak az 5% az aminél a többség meghúzza a határt

Answer 67

1% alatti p -érték nem jelzi azt hogy mindenesetben sokat nyom latba az eltérés amit észrevettünk lehet gyakorlati jelentősége nincs

Answer 68

Egyoldalú próbát használunk, hogyha az ellenhipotézis azt mondja, hogy a doboz átlaga nagyobb egy bizonyos értéknél. Kétoldalú próbát használunk, ha az ellenhipotézis annyit mond, hogy a doboz átlaga eltér egy bizonyos értéktől – kisebb vagy nagyobb nála.

Answer 69

a várható és a megfigyelt gyakoriságok közötti távolságot méri. X^2(khi négyzet) = (megfigyelt gyakoriság - várható gyak)^2 ------------------------- várható gyak magas khi érték: távol esnek a gyakoriságok alacsony: megfigyelt gyakoriságok a várhatóak közelében maradnak megértéséhez példa: megakartuk figyelni hogy gyanúsan sokszor jön-e ki valami érték 0-1 dobozmodell felállítása- pl ha két kategória van- 1, bejön a tipp 2, nem jön be a tipp megnézzük melyiknek mekkora az esélye (1/6 vagy ilyesmi) de: dobókocka pl hogyan tudjuk meg hogy szabályos vagy megcinkelték? van hat kategória - nem állíthatok fel dobozmodellt- kell a khi próba

Answer 70

(Ha számít, hogy melyik fajta lapból hány van a dobozban, a χ 2 -próba a jó; ha viszont csak a doboz átlaga számít, dolgozzunk z-próbával.) * A χ2 -próba megmondja, hogy adataink olyanok-e, mintha egy adott összetételű dobozból végeztünk volna véletlen húzásokat. * A z-próba megmondja, hogy adataink olyanok-e, mintha egy adott átlagú dobozból végeztünk volna véletlen húzásokat.

Answer 71

várható gyakoriságok átlaga

Answer 72

képlet alapján megkapjuk a khi értéket megnézzük a szabadságfokokat (nem függetlenségvizgsálat esetében) : összeadandó törtek khi képletben - 1 szabadságfokok táblázatban- jobboldalra fekvő értékek %át jelzi a fenti szám

Answer 73

függetlenségvizsgálat (pl: befolyásolja-e a jobb vagy balkezességet hogy nő vagy férfi vagy) p érték ugyanúgy jobbra fekvő értékek százaléka kell -nincs változás (várható érték kiszámolása trükkös de rá lehet jönni -gyakorolni kell) szabadságfokok számolása változik: (táblázat oszlopainak száma-1) * (táblázat soraink száma-1) (kis p érték ugyanúgy azt jelenti, hogy valóságos az eltérés, el kell vetni a nullhipotézist hogy nem függ egymástól a két tényező)

Answer 74

két kísélret khi négyzet próba értékeit összeadom -mind szabadságfokokat mind a khi négyzet értékeket ez alapján megvizsgálom**** **a balra fekvő területet **** a khi görbén nullhipotézis: minden rendben ellenhipotézis: várható értékek gyanúsan közel a megfigyelt értékekhez ha kicsi a p-érték : khi értékeke az ellenhipotézist támasztják alá

Answer 75

. Amikor nagy a minta, olyankor a χ2 -próba nagyon jó modelleket is megcáfol.

Answer 76

pontdiagram

Answer 77

függő változó független változó független magyarázhatja a függőt

Answer 78

: az x koordináta növekedésével a pontok y koordinátái is felfelé tendálnak

Answer 79

jelölése: R A korrelációs együtthatóval mérhetjük a lineáris összefüggést, azaz a pontok tömörülését egy egyenes körül (szórásokhoz viszonytíva!) . Ha a korrelációs együttható értéke közel van a +1-hez, akkor a két adathalmaz elemei között erős pozitív korreláció van: azaz, ha az egyik adatsor értéke nő, akkor a másik adatsor hozzá tartozó elemeinek értéke is nőni fog. Ha a korrelációs együttható értéke közel van a -1-hez, akkor a két adathalmaz elemei között erős negatív korreláció van: azaz, ha az egyik adatsor értéke nő, akkor a másik adatsor hozzá tartozó elemeinek értéke csökkenni fog. Ha a korrelációs együttható értéke közelít a nullához, akkor a két adathalmaz elemei között nincs lineáris kapcsolat.

Answer 80

: r = 0,80 nem azt jelenti, hogy a pontok 80%-a csoportosulna szorosan egy egyenes körül, és azt sem, hogy kétszer annyira lenne lineáris a kapcsolat, mint r = 0,40 esetén.

Answer 81

a pontok egy lefelé menő egyenes körül tömörülnek

Answer 82

A korreláció két adathalmaz közötti kapcsolat nagyságát és irányát jellemzi. A korreláció összefüggést mér. Az összefüggés azonban nem egyenlő az oksági kapcsolattal.

Answer 83

szórásegyenes: átmegy az átlagponton, és egy vízszintes szórásnyi távolságon egy függőleges szórásnyit emelkedik. Rövidebben szólva, a meredeksége: (y szórása) / (x szórása). Ez érvényes pozitív összefüggés esetén. Ha a korrelációs együttható negatív, akkor az egyenes lefelé tart, a meredeksége tehát: - (y szórása) / (x szórása).

Answer 84

két változó standard egységre váltása szorzatának átlaga !

Answer 85

van x változó: 5, 10, 3, 4, 7 y változó: 6, 7, 8, 9, 10 x változónak kiszámoljuk az átlagát a szórását majd: 5-átlag/szórás -----ezt végig csinálni az összes értékkel. az összes érték mellé írni x esetén y átlagnál is megcsináljuk (kettőt összeszorozni--szorzatok átlaga= korrelációs együttható)

Answer 86

-valószínűségi mintáknál a véletlen hiba **valószínű** nagyságát megadja a standard hiba

Answer 87

a változókat felcseréljük, a változó minden értékéhez hozzáadjuk ugyanazt a számot, a változó minden értékét megszorozzuk ugyanazzal a pozitív számmal. (pl: csak olvasni- nem számít ha fahrenheitben vagy celsiusban írjuk le ugyanazokat a napokat, ugyanakkora lesz az R)

Answer 88

bemagolós mondat: A korrelációs együttható azt méri, hogy mennyire szorosan csoportosulnak a pontok egy egyenes köré, **a szórásokhoz viszonyítva.** magyarázat: A korrelációs együttható kiszámításakor standard egységre váltjuk át változóinkat: az átlagtól vett eltéréseket elosztjuk a szórással. **Az r tehát a tömörülés szorosságát relatíve, a szórásokhoz viszonyítva méri, nem pedig abszolút számokban.**

Answer 89

Az r a lineáris összefüggést méri, nem pedig az összefüggést általában véve. Ha 1, előfordulnak kiugró értékek, vagy 2, ha az összefüggés nemlineáris, a korrelációs együttható félrevezető lehet.

Answer 90

Egy ökológiai korreláció arányszámokon vagy átlagokon alapul. A politikatudományban és a szociológiában gyakran használnak ilyeneket. Az ökológiai korreláció jellemzően eltúlozza az összefüggés erősségét. Az arányszámok vagy átlagok alapján nyert korreláció félrevezető lehet (ha adatokat átlaggal jellemzünk, akkor figyelmen kívül hagyjuk a szóródást az átlag körül).

Answer 91

Kisiskolások körében az olvasási készség erősen korrelál a cipőmérettel. Új szavak megtanulástól azonban nem lesz nagyobb az ember lába. Inkább egy harmadik tényező játszik itt szerepet—az életkor. Ahogy idősebb lesz a gyerek, egyre jobban megtanul olvasni, és sorra növi ki a cipőit is. (A 2. fejezetben használt statisztikai zsargon szerint összemosó tényező itt az életkor.) Ennél a példánál könnyű volt megtalálni az összefüggést összekuszáló változót. De nem mindig ilyen egyszerű a helyzet. A korrelációs együttható kiszámítási eljárása nem nyújt védelmet ilyen releváns harmadik változókkal szemben.[5]

Answer 92

A regressziószámítás azt írja le, hogy hogyan is függ az egyik változó a másiktól. Az x egy szórásnyi növekedéséhez az y értékeknek csak r szórásnyi növekedése társul. Ha ábrázoljuk ezt a regressziós becslést, megkapjuk y x-re vonatkozó regressziós egyenesét.

Answer 93

Nemlineáris összefüggés. Nem használható a regressziós egyenes akkor, amikor a változók közötti összefüggés nem egyenesen arányos (azaz nem lineáris).

Answer 94

Az átlagdiagram sokszor egy egyeneshez közelít, bár kissé hepehupás lehet. A regressziós egyenes kisimítja az egyenetlenségeket. Ha az átlagok egy vonalba esnek, akkor ez a vonal a regressziós egyenes.

Stat felvételi Flashcards

(121 cards)