štatistika 2 Flashcards

(58 cards)

1
Q

Pokud má proměnná málo
kategorií, popisujeme ji pomocí ?

A

frekvenční tabulky (s
procenty)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Pokud má proměnná hodně kategorií, popisujeme ji pomocí ?

A

aritmetického průměru (a směrodatné odchylky)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Čo je jednorozmerná (univariačná) analýza?

A

Analýza jednej premennej, zameraná na jej rozdelenie (napr. frekvencie, priemer, rozptyl).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Aké metódy používame pre kategorizované premenné v jednorozmernej analýze?

A

Frekvenčné tabuľky, stĺpcové/koláčové grafy, modus, medián.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Aké metódy používame pre kontinuálne premenné v jednorozmernej analýze?

A

Priemer, rozptyl, histogramy, box-ploty, kvantily, percentily.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Čo je dvojrozmerná (bivariačná) analýza?

A

Analýza vzťahu medzi dvoma premennými (napr. vek a príjem).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Aké sú 3 hlavné typy dvojrozmernej analýzy podľa typu premenných?
+ akou metódou skúmame ich vzťah? + príklad

A

Kategória vs. kategória (kontingenčná tabuľka) –> vzdělanostní kategorie podle
pohlaví

Kategória vs. kontinuum (porovnanie priemerov) –> . příjem podle
pohlaví

Kontinuum vs. kontinuum (korelácia, regresia) –> příjem podle
věku

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

ktorá premenná je predpokladanou príčinou?

A

nezávislé premenná X

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

ktorá premenná je predpokladaným dôsledkom ?

A

závíslá Y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

2 významy testovania hypotéz - vecná a štatistická rovina - definuj + aká štatistika

A
  1. vecná rovina = overujeme, či vzorce v dostupných dátach zodpovedajú predpokladu hypotézy (resp. nie sú s ňou v rozpore) – POPISNÁ (DESKRIPTÍVNA) ŠTATISTIKA
  2. štatistická rovina = overujeme, či to, čo sme objavili vo vzorke, môže platiť aj v populácii – INFERENČNÁ ŠTATISTIKA
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

2 zásadné problémy bivariačnej analýzy

A

Problém zovšeobecniteľnosti : Platí to, čo sme zistili v našom výberovom súbore, aj pre celú populáciu? –> To zistíme v 2. semestri v rámci tzv. štatistickej inferencie.

Problém kauzality: Skutočnosť, že respondenti s rôznym vzdelaním dosahujú rôzny vek, znamená, že vzdelanie ovplyvňuje vek, vek ovplyvňuje vzdelanie, alebo ide o náhodu?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Kritériá kauzálneho usudzovania:

A
  1. súbežné zmeny v premenných
  2. časová následnosť príčiny a dôsledku
  3. vylúčenie vonkajšieho (iného) vplyvu
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

srovnání priemerov(kategória vs kontinuum) - na čo dávať pozor

A

A) Venujme pozornosť rozloženiu závislej premennej v daných skupinách.
B) Zvážme, aký veľký rozdiel v priemeroch je vecne dôležitý. –> Napríklad: 100-bodová škála, rozdiel 5 bodov vs. 10-bodová škála, rozdiel 5 bodov.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

kontingenčná tabuľka

A
  • kategória vs kategória
  • ROZDĚLENÍ ČETNOSTÍ JEDNOTLIVÝCH KATEGORIÍ PODLE DALŠÍ PROMĚNNÉ
  • Používa sa v prípade, keď analyzujeme vzťah dvoch premenných s málo kategóriami.
  • Nezáleží na tom, ktorá premenná sa mení závisle a ktorá nezávisle
    Statistics – Contingency Table – Two-way table
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

korelácia

A

= štatistická metóda, kt. ukazuje silu vzťahov dvoch premenných

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Ak sa dve premenné menia súbežne a nezávisle?

A
  1. majú silnú koreláciu
  2. majú slabú koreláciu
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Korelačný koeficient - volíme podľa?

A

Podľa typu premenných a počtu jej kategórii volíme správny koeficient korelácie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q
  • Všetky koeficienty nadobúdajú hodnoty? + čo znamenajú? + znamienka?
A
  • 0-1
  • hodnota 0 znamená neexistujúci vzťah, hodnota 1 znamená veľmi tesný vzťah
  • Výsledok môže mať znamienko + (priama úmera) alebo – (nepriama úmera)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Priama (korelácia kladná)

A
  • keď jedna premenná rastie, rastie aj druhá
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Nepriama (korelácia záporná)

A
  • keď jedna premenná rastie, druhá klesá
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

postup vyhodnotenia korelácie 6

A
  1. Zvolíme správný koeficient
  2. Provedeme výpočet correlation matrix/correlation test
  3. Vyhodnotíme směr korelace
  4. Vyhodnotíme sílu korelace (bez ohledu na znaménko)
    o Pozor, nedíváme se vůbec na znaménko
    o Korelace – 0,35 je stejně silná jako korelace + 0,35
    o Liší se jen směrem souvislosti (přímá, nepřímá)
  5. Vyhodnotíme zobecnitelnost výsledku
  6. Vše číselně i slovně popíšeme
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

korelačné koeficienty

cramérovo V ?

A

pre nominálne premenné

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

kendallovo tau?

A

pre ordinálne premenné

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

pearsonovo r ?

A

pre kardinálne premenné

25
spearmanovo rhó?
pre kardinálne premenné (menej citlivé na extrémne hodnoty)
26
Kauzalitu můžeme odhadovat ze splnění podmínek:
1. **Obe premenné sa menia spoločne - zjistíme pomocí bivariační analýzy** (kontingenční tabulka, srovnání průměrů) 2. **Zmeny prebiehajúce v logickom poradí - logickou úvahou** 3. **Zmeny niesú spôsobené vplyvom daších premenných** - pomocí elaborace vlivu třetí proměnné
27
Phi
* nominálne * jen pro tabulky 2×2, pro větší tabulky dává nesmyslné výsledky, nepoužívat
28
Contingency coefficient
* nominálne * : závisí na počtu sloupců, nepoužívat
29
Cramer V
* nom * : pro obdélníkové i čtvercové tabulky, doporučený koeficient
30
Lambda:
* nom * ukazuje v intervalu do jaké míry četnosti kategorií nezávisle proměnné dokáží předvídat četnosti kategorie závisle proměnné – je potřeba správně nastavit směr vztahu, koeficient je tzv. asymetrický
31
Goodmanovo Kruskalovo tau:
* nom * pro asymetrické vztahy (musíme určit, která proměnná je nezávisle a která závisle proměnná)
32
Uncertainty coef.
* nom * má symetrickou i asymetrickou podobu.
33
čo je konkordácia
* zhoda - keď má R2 v X1 a X2 vždy vyššiu hodnotu ako R1
34
čo je diskordancia ?
* nezhoda, ak má jedno vyššiu hodnotu v jednej premennej a nižšie v druhej - keď hodnoty R2 sú v X1 nižšie a v X2 vyššie než u R3
35
čo su spřažená poradí?
* tied ranks, keď majú v jednej premennej rovnakú hodnotu - napr. R3 a R4 majú obe v X1 hodnotu 3
36
Kendallovo tau b a c
* ordinálne premenné * B -čtvercové tabulky * C -obdélníkové tabulky
37
Somersovo D
* ordinál * pro asymetrické vztahy (musíme určit směr, tedy závisle a nezávisle proměnnou)
38
na čom sú založené koeficienty pre ordinálne premenné?
Většina z nich je založena na zjištění míry souhlasu (konkordance) a nesouhlasu (diskordance) udvojic hodnot u analyzovaných proměnných
39
spearmanovo rhó je založené na ? kedy sa využíva?
* poradí hodnôt * proto s výhodou používá v případech, kdy jsou proměnné ordinální nebo kardinální (důležitá je možnost proměnné seřadit podle velikosti) a výsledek by mohl být zatížený extrémními hodnotami (outliers). Není také závislé na linearitě vztahu
40
Pearsonovo r predpokladá ? ak vzťah není lineárny?
* kardinálne * předpokládá, že mezi proměnnými existuje linární vztah, tedy že platí y=a × x * jedna proměnná se mění „konstantním tempem“ v závislosti na změnách druhé proměnné * Pokud není mezi x a y lineární vztah, může vyjít Pearsonovo r klidně nulové, což ale neodpovídá realitě * je citlivý na extrémní hodnoty a vyhodnocuje jen linearitu vztahu
41
čo je nutné skontrolovať pri koeficientoch pre kardinálne premenné ?
* nutné zkontrolovat linearitu vztahu pomocí bodového grafu * V případě pochybností použít nelineární korelaci
42
koeficient eta
* Pro speciální případy – srovnání průměrů * Nezávisle proměnná kategorizovaná (málo kategorií) * Závisle proměnná kardinální (věk podle vzdělání/pohlaví)
43
sila účinku
* Eta2 -> měří velikost účinku jedné proměnné na druhou * Podobně Pearson2 nebo Spearman2 vyjadřuje tzv. koeficient determinace (obecně i pro jiné případy než málo × hodně kategorií) * Po vynásobení × 100 získáváme údaj v procentech: jak velkým dílem (v %) vysvětluje nezávisle proměnná variabilitu proměnné závisle
44
varianta málo × hodně kategorií
srovnání průměrů
45
varianta málo × málo kategorií
kontingenční tabulka
46
všechny varianty
korelace a asociace
47
Falošný vzťah
= Zdanlivý vzťah medzi premennou X a Y je vlastne spôsobený pôsobením premennej t * Zdanlivý, klamný, spurious vzťah * Matúca, confounding premenná * Správne sa tak jedná o dva vzťahy: 1. medzi t a X a 2. medzi t a Y
48
Sprostredkovaný vzťah
= Zdanlivý vzťah medzi X a Y je vlastne tvorený dvoma vzťahmi: 1. medzi X a t 2. medzi t a Y * Nepriamy, sprostredkovaný, mediated * Intervenujúca premenná, mediator
49
Špecifikovaný vzťah
= vzťah medzi X a Y existuje iba pre kategóriu t1, nie pre kategóriu t2 * Vzťah špecifikujeme pre vybrané kategórie premennej * Interakčný efekt (špecifikácie a interakcie sú synonymá)
50
Žiadny efekt
= Ani po pridaní tretej premennej sa pôvodný vzťah medzi X a Y nezmení
51
Dvojitá príčina
= Premennou Y ovplyvňuje nie len premenná X (existuje vzťah medzi X a Y) ale tiež premenná Z (existuje vzťah medzi Z a Y)
52
ako postupovať analyticky pri elaborácii?
1. vždy začíname vzťahom 2 premenných, vzťah volíme podľa typ premenných a dosavadných znalostí (porovnanie priemerov, kontingenčná tabuľka, korelácia) 2. pridáme do vzťahu 3 premennú 3. Vzťah medzi dvoma premennými prepočítame pre jednotlivé kategórie tretej premennej – z triedenia druhého stupňa vznikne triedenie tretieho stupňa 4. Sledujeme zmenu všetkých koeficientov
53
Parciálna korelácia: 4 scénáre koeficient se nezmění, klesne k nule,klesne částečně, se zvýší
1, koeficient se nezmění: testová proměnná nemá vliv na původní vztah 2, koeficient klesne k nule: testová proměnná vysvětluje původní vztah (když klesne k nule, vysvětluje vztah zcela) 3, koeficient klesne částečně: testová proměnná vysvětluje původní vztah částečně 4, koeficient se zvýší: nutná další analýza
54
Ekologický klam Ecological fallacy
= Z údajů o celku se dělají predikce týkající se individuálních případech Příklad: V území A je vyšší sebevražednost než v území B, V území A žije více protestantů  Závěr (nesprávný): protestanti páchají více sebevražd
55
Individualistický klam Individualistic fallacy
= Na základě informací o jednom případu zobecňujeme na vlastnosti celé populace nebo naopak své zobecnění měníme Příklad: Vyšší vzdělání vede k vyšším příjmům , Ale: Bill Gates nedokončil vysokou školu  Pozor: kvůli jedné výjimce nemůžeme zamítnout obecný trend
56
Simpsonov paradox
= Vztah mezi dvěma proměnnými po zavedení třetí proměnné nejen zmizí, ale obrátí se Príklad: V nemocnici A zemřelo 200 pacientů z 1000 (úmrtnost 20 %), v nemocnici B zemřelo 100 pacientů z 1000 (úmrtnost 10 %) Znamená to, že nemocnice A je horší než nemocnice B?  Pokud zavedeme třetí proměnnou – zdravotní stav přijímaných pacientů, ukazatel se obrátí Nemocnice A: úmrtnost kritických pacientů 5 %, nekritických 10 % Nemocnice B: úmrtnost kritických pacientů: 9 %, nekritických 15 %
57
aký graf zvolím ak mám typ premennej s málo kategóriami?
koláčový, sloupcový
58
aký graf zvolím ak mám typ premennej s veľa kategóriami?
histogram, box plot