štatistika Flashcards

(88 cards)

1
Q

Čo je to štatistika?

A

Vedný odbor zaoberajúci sa metódami kvantitatívneho hodnotenia hromadných javov a procesov

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Aké sú 3 ciele štatistickej analýzy?

A
  • Popísať jav
  • Vysvetliť jav
  • Predikovať jav
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Čo sú hromadné dáta?

A

Informácie o väčšom počte výskumných jednotiek a ich charakteristikách, ukladá sa do datovej matice

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Čo je to výskumná otázka?

A

Zhrňuje cieľ nášho výskumu, má podobu opytovacej vety

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

čo je prípad (case)?

A

: výskumná jednotka, jednotka analýzy

Môže sa jednať o jednotlivca, rodinu, mesto, inštitúciu, vydanie novín

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Čo je hypotéza?

A

Veta o vzťahu (najmenej) dvoch premenných, vychádza z čiastkovej výskumnej otázky

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Aké sú typy premenných?

A
  • Nominálne
  • Ordinálne
  • Spojité
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Čo je závislá premenná?

A

Vysvetľovaná, premenná, ktorá je ovplyvňovaná inými nezávislými premennými, reprezentuje uvažovaný následok

príjem, šťastie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

nezávislá premenná

A

vysvetľujúca, prediktor, determinant, premenná kt. ovplyvňuje iné premenné, reprezentuje príčinu našej hypotézy

vek

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Aké sú druhy hypotéz?

A
  • Teoretická - odvodzované z teórie, ponúkajú predbežné vysvetlenie otázky typu prečo
  • Štatistická/pracovná/empirická - používané k zovšeobecňovaniu výsledkov z reprezentatívneho výberového súboru na cieľovú populáciu
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

na aké 3 otázky odpovedá paradigma?

A

ontologická otázka (jaká je povaha reality kterou zkoumáme),
epistemologická otázka (jaká je podstata poznání),
metodologická otázka (jakým způsobem se produkuje vědění, porozumění a pochopení)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

validita

A

či je vytvorený merateľný znak dobrým, schopnosť merať to, čo skutočne merať chceme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

operacionalizácia

A

prevod abstraktných konštruktov do merateľných znakov

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Aké sú aspekty merania?

A
  • Relevantnosť
  • Validita
  • Reliabilita
  • Senzitivita
  • Presnosť
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Aké sú základné chyby merania?

A
  • Náhodná chyba (šum) = priemer je nedotknutý, není tak závažná
  • Systematická chyba = skreslenie, vychýlenie, chyba výzkumníka nebo v. nástroje
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Čo je nominálna premenná?

A

Hodnoty sú kategórie označené číselnými kódmi, ktoré nie je možné zoradiť do poradia, a kt. im výskumník priradil

  • priradené číslo je iba symbolom, neoznačuje ani množstvo meranej vlastnosti, zisťujeme či sa jednotlivé kateg. vyskytli alebo nie, ak áno tak ako často

*Napr. farba vlasov (1.čierna 2.gaštanová), okresy ČR, druhy zamestnania

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Čo je ordinálna premenná?

A

Kategórie sa dajú usporiadať do poradia, ale nezisťujeme stupeň odlišnosti

  • Vieme zistiť kt. je v poradí vyššie ako iná, zobrazujú iba poradie, nie stupeň odlišnosti, nedokážeme zistiť o aké množstvo spokojnosti sa líši „veľmi spokojná“ od „spokojná“

* Napr. miera spokojnosti, stupeň dosiahnutého vzdelania, dni v týždni

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Čo je kardinálna premenná?

A

Jej číselné kategórie vyjadrujú skutočné množstvo sledovanej vlastnosti

  • Jednotlivé kat. môžeme zoradiť do poradia a aj povedať o aké množstvo sa líšia

Napr. vek, príjem, počet detí porodených

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Doplnte: Premenné _______ môžu nadobudnúť iba určitých hodnôt.

A

diskrétne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Doplnte: Premenné _______ nadobudnúť akékoľvek hodnoty.

A

spojité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Doplnte: Premenná _______ nadobúda iba 2 kategórie.

A

dichotomická

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Aké sú zásady kvantitatívneho výskumu?

A
  • Vedecká preukázanosť výsledkov
  • Logicky správny a metodologicky čistý design
  • Nahradenie designu dodatočnými štatistickými úpravami nie je prípustné
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Čo je míra centrální tendence?

A

Trend ve statistice (průměr, medián, modus)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Čo je cieľová populácia?

A

Okruh osôb vymedzených sociálnymi/demografickými vlastnosťami, pre ktoré chceme vysloviť závery

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Co je to rozptyl?
aritmetický priemer (odchýlok od priemeru) na druhú | * Slúži predovšetkým pre výpočet smerodatnej odchylky
26
Co je to systematická chyba?
Skreslení, vychýlení, chyba výzkumníka nebo nástroje, například neoprávněným zobecněním.
27
Jaké aspekty by mělo splňovat měření?
Měření by mělo být: relevantní, validní, reliabilní, senzitívní a přesné.
28
Definice relevance v měření.
vhodnosť použitej procedúry vo vzťahu k meranému problému
29
Co je validita v kontextu měření?
Rozsah, ve kterém měření koresponduje se skutečnou vlastností, kterou chceme měřit.
30
Jak se definuje reliabilita?
Rozsah, ve kterém způsob měření dává konzistentní výsledky.
31
Co je senzitívita testu?
Schopnost testu dávat pozitivní odpověď, pokud má dotazovaný příslušnou vlastnost.
32
Co je specificita testu?
Schopnost testu dávat negativní odpověď, pokud dotazovaný nemá příslušnou vlastnost.
33
Co je hypotéza?
Věta o vztahu (nejméně) dvou proměnných vycházející z výzkumné otázky.
34
Jaký je rozdíl mezi tématem a výzkumným problémem?
Téma je předmět výzkumu, na výzkumný problém odpovídáme prostřednictvím výzkumu.
35
Jaké typy hypotéz rozlišujeme?
Teoretické, empirické, výchozí, pracovní, kauzální, vztahové, věcné a statistické.
36
Co je teoretická hypotéza?
Výrok vycházející z teorie.
37
Co je empirická hypotéza?
Empiricky testovaný výrok.
38
Co je výchozí hypotéza?
Teoretická nebo empirická, komplexní.
39
Jaká je definice kauzální hypotézy?
Proměnné jsou asociovány nebo korelovány, musejí existovat jejich souběžné změny.
40
Co je vztahová hypotéza?
Hypotéza s pravděpodobnostním charakterem.
41
Co je věcná hypotéza?
Týká se existence, výskytu, vlastností, vztahů, vývoje či procesů jevů.
42
Co je statistická hypotéza?
Hypotetické tvrzení o relacích.
43
Jaké jsou typy modelů?
abstraktný popis systému, konceptuálne modely, teoretické modely
44
fáze štatistickej analýzy | 9
1. výběr jednotek pro sledování (druh výběru - pravděpodobnostní, kvótní, záměrný atd.) 2. zjišťování údajů (pomocí pozorování a měření vlastností) 3. kontrola údajů (návratnosti, úplnosti, nerozpornosti) - fáze “čištění dat” 4. třídění údajů (rozložení jevů) 5. výpočet statistik (středních hodnot, sledování časové a věcné proměnlivosti jevů 6. vyjádření rozložení jevů (v tabulkách, grafech, číselných řadách) 7. relační (vztahová) analýza (jednoduchá, více faktorová, kauzální souvislost) 8. statistická verifikace hypotéz (! nevyhnutelné pravděpodobnostní chyby) 9. inferenční statistika (statistická indukce, zobecnění výsledků na celou populaci, ! pravděpodobnost platnosti)
45
Co je to frekvenční tabulka?
Tabulka, která zobrazuje počet odpovědí v dané kategorii.
46
Jak se vypočítává procento v frekvenční tabulce?
100 * podíl odpovědí v dané kategorii / součet všech validních odpovědí.
47
Co je míra centrální tendence?
Jedno číslo reprezentující celý datový soubor.
48
Jak se definuje aritmetický průměr?
* Súčet všetkých hodnôt danej premennej vydelený počtom týchto hodnôt
49
Jaký je rozdíl mezi průměrem a mediánem?
Průměr je citlivý na extrémní případy, medián nebere v úvahu absolutní hodnoty
50
Co je modus?
* Vyjadruje hodnotu, kt. je najčastejšou hodnotou danej premennej (vhodné pre nominálne) | * 1,2,2,2,5 --> 2
51
Jak se definuje vážený aritmetický průměr?
vynásobím číslo jeho váhou a vydelím súčtom váh
52
Jaké jsou podmínky proměnné?
**Rozlišitelnost** - medzi vlastnosťami, musí variovať (M X Ž) **zaraditelnost** - ke každému stavu vlastnosti existuje příslušná hodnota znaku (ke každé politické straně je přiřazena hodnota) **jednoznačnost** - dvě různé hodnoty znaku nemohou odpovídat jednomu stavu vlastnosti **reprezentativnost** dat - umožní zobecnění, při určitém typu výzkumu není nezbytné
53
Jaké jsou míry variability pro různé typy proměnných?
Míry variability zahrnují rozptyl, směrodatnou odchylku, variační koeficient a variační rozpětí.
54
Co je normální rozložení?
Normální rozložení je statistické rozložení, které je symetrické a má tvar zvonové křivky.
55
Jaké jsou charakteristiky spojitých proměnných?
Charakteristiky spojitých proměnných zahrnují míry centrálnej tendencie jako modus, medián a průměr.
56
Co znamená šikmost a špičatost v kontextu normálního rozložení?
Šikmost - ako sú hodnoty (a)symetricky rozložené okolo priemeru špičatost - ako je rozdelené špicaté (strmé) alebo naopak ploché
57
Jaký je koeficient šikmosti pro normální rozložení?
Koeficient šikmosti = 0 pro normální rozložení. (symetrické)
58
Jaký je koeficient špičatosti pro normální rozložení?
Koeficient špičatosti = 0 pro normální rozložení.
59
Jaký test se používá pro kontrolu normality rozložení?
Kolmogorov-Smirnov test (KS test) se používá pro kontrolu normality.
60
Jaké hodnoty jsou považovány za normální v Kolmogorov-Smirnov testu?
P-value > 0,05 znamená, že rozložení je normální.
61
čo je variačné rozpätie?
= rozdiel medzi minimom a maximom | * 18-80 vek vo vzorke, variačné rozpätie = 80-18
62
Jaká je definice směrodatné odchylky?
= je Aritmetický priemer (odchýlok od priemeru) dá sa vypočítať ako odmocnina z rozptylu
63
čo je variační koeficient?
* Smerodatná odchylka vydelená priemerom krát 100
64
Jaké jsou důležité kvantily?
Důležité kvantily zahrnují: *Kvintil (20%)*, *Kvartil (25%)*, *Decil (10%)*, *Percentil (1%)*.
65
Co je boxplot?
Boxplot je grafické znázornění distribuce dat, které ukazuje minimum, maximum, kvartily a medián.
66
Jaké jsou vlastnosti normálního rozložení podle pravidla šesti sigma? | 2
95% v ±1,96, 99% v ±2,58 násobku smerodatnej odchylky od priemeru
67
Jaké podmínky musí být splněny pro použití parametrického testu?
Podmínky zahrnují: normalitu rozdělení, shodu rozptylů, intervalová data a nezávislost měření.
68
Jak se provádí vážení souboru?
Vážení souboru se provádí, když je nějaká kategorie pod nebo nad reprezentována, podreprezentované kategorie budeme počítat vícekrát a naopak
69
Co je to transverzální výzkum?
Transverzální výzkum je prováděn v jednom časovém okamžiku.
70
Jaké typy vah existují?
Typy vah zahrnují: *designové* a *poststratifikační*.
71
Co znamená centrovaná data?
Centrovaná data jsou výsledkem transformace, kde od každé hodnoty odečteme průměr.
72
Jaký je význam z-skóre?
Z-skóre pomáhá srovnávat proměnné s různými jednotkami. * udává - kolik směr. odchylek je určitý případ nad nebo pod průměrem o např. (81-70) / 5 = +2,2 (dvě směr. odchylky od průměru) (= standardizované skóre, jeho výpočet jedním ze způsobů transformace) - převod původních hodnot na hodnoty s průměrem
73
Jaké jsou hlavní charakteristiky normálně standardizovaného rozložení?
- Má priemer = 0 - Má smerodatnú odchylku = 1 - Vytvára sa pomocou z-skóra - Vhodné pre porovnávanie premenných s rôzne dlhými škálami napr. HDP vs.vzdelanie
74
Jaké jsou základní principy úpravy dat?
Základní principy zahrnují rekódování proměnných, výpočty proměnných a přejmenování proměnných.
75
čo je to chyba?
rozdíl mezi pozorování a predikcí (odhadem)
76
čo je to survey?
nejčastější dotazníkové šetření pro sběr hromadných dat
77
Validné (percentá)
= podiel odpovedí v danej kateg. bez započítania chýbajúcich hodnôt
78
Podiel (percentá)
= podiel odpovedí v danej kateg., zahrňuje aj chýbajúce hodnoty (missing values, NA)
79
# frekvenčná tabuľka Počet (frekvencia)
= absolútny počet odpovedí v danej kategórií, vzhľadom k tomu, že každá kat. má iný počet platných odpovedí, väčšinou neuvádzame
80
Kumulatívne (percentá)
= podiel odpovedí v danej kateg. a všetkých kat. predchodzích, má zmysel iba u ordinálnych (zoradených) premenných, uvádzať ho u nominálnych je chyba, pre čitateľa väčšinou nemá zmysel
81
medián
* Vyjadruje hodnotu, kt. je presne v polovici, ak hodnoty premennej zoradíme | 1,2,3,4 --> 2,5
82
testovanie normálneho rozlozenia | 4
1. Graficky: z histogramu odhadujeme, či je rozloženie normálne 2. Z šikmosti a špicatosti: obe hodnoty sú nulové (alebo veľmi blízké nule) 3. Q-Q graf: všetky body sú umiestnené na priamke 4. Kolmogorovův-Smirnovův test: signifikácia tohto testi je väčšia ako 0,05, ak je rozloženie premennej normálne
83
Normálne (Gaussovo) rozloženie
* Vychádza z centrálnej limitnej vety * Odpovedá rozloženiu rady fyzikálnych a prírodných javov Štatistické procedúry predpokladajú pri dostatočne veľkom súbore normálne rozloženie
84
# Práca s datasetmi spojenie datasetov
merge
85
# Práca s datasetmi výber prípadov
subset
86
# Práca s premennými zmena poradia kategórii
reorder
87
# Práca s premennými rekódovanie kategórii
recode
88
# Práca s premennými výpočet nových premenných
compute