Statistika Flashcards Preview

Přijímačky > Statistika > Flashcards

Flashcards in Statistika Deck (29)
Loading flashcards...
1

Charakteristiky centrální tendence?

2

Co je variační rozpětí?

R = Xmax - Xmin

3

Jak spočítám rozptyl?

Hodnota minus populační průměr.

4

Jak spočítám směrodatnou odchylku?

Odmocním rozptyl.

5

Co je to variační koeficient?

Bezrozměrná jednotka (někdy se převádí na procenta) a určuje jak je vzorek nesourodý na hodnotách [-0,5; 0,5]

6

Kdy použiji harmonický průměr?

Když průměruji procenta.

7

Kdy použiji vážený harmonický průměr?

Kdy průměruji procenta, která nepochází z rovnoměrných dat.

8

Jak je definována pravděpodobnost?

Jako [0-100]%. jedná se o pravdepodobnost výskytu náhodného jevu.

9

Co říká klasická teorie pravděpodobnosti?

Pravděpodobnost pokusu je vždy stejná.

10

Co říká statistická teorie pravděpodobnosti?

Že jev je závislý na příznivých a možných jevehc, tedy:

P(x) = počet příznivých jevů / počet všech možných jevů

11

Co znamená průnik jevů?

Když jevy nastanou současně.

P(A ∩ B) = P(A) x P(B) = 0,7 x 0,55 = 0,385 = 35,5%

12

Co je sjednocení jevů?

Sloučení dvou jevů do jednoho.

Px (A ∪ B) = ( P(A) + P(B) ) - P (A ∩ B) = (0,7 + 0,55) - (0,7 x 0,55) = 1,25 - 0,385 = 0,865 = 86,5 %

13

Co je to normální veličina a jak se spočítá?

Odpovídá normální rozložení parametrů v populaci.

 

Jedna z klasických normální veličin je Z skór.

14

Co je konfidenční interval?

Přesnost, se kterou udáváme interval spolehlivosti.

95% klasicky p < 0,05

1 - α - chyba odhadu = 1 - 0,95 = 0,5% možné chyby

15

Co je to t test?

Součást inferenční statistiky. udává pravděpodobnost, že jevy A a b jsou rozdílné, tedy, že pochází z jiné populace. Porovnává rozptyly skupin.

t = rozptyl mezi skupinami / rozptyl skupin

Je třeba 20-30 vzorků do skupiny.

16

Jaké jsou typy t testů?

  1. nezávislé - Mann-Whitney U test
  2. párové - Wilcoxon t test (data pochází ze stejného vzorku)
  3. individuální - porovnání vzorku s populací

17

Jak vypadá výstup t testu?

Testosterol produkuje cholestrol t(99) = 0,33, p = 0,37, ale nebyl zjištěný signifikantní rozdíl (testosterol M = 34, kontrolní M = 36).

99 = df

t = hodnota t testu

p hodnota (kritická hodnota)

M - průměr

18

Co je to ANOVA?

Zjišťuje rozdíly mezi skupinami (dva a více skupin) porovnáváním průměrů.

SSW - suma čtverců skupin

SST - celková suma čtverců

SSB - suma čtvrců mezi skupinami

 

SSB / df = 101,667

SSW / df = 54 / 14 = 4,5

F = ( SSB / df ) / ( SSW / df ) = 22,59 > kritická hodnota 3,39

 

Zápis:

F(2,12) = 22,59, p < 0,05

2 = df ( n - 1)

12 = df celkem - skupin ( n - sk)

19

Jak spočítám X2 chi-kvadrát?

Naměřené minus očekávané na druhou děleno očekáváné

df = n - 1

Jak přesáhne kritickou mez - zamítám H0

20

Co je matematická regrese?

Když spolu dvě proměnné korelují a můžeme z jedné proměnné odhadovat druhou proměnnou.

21

Typy matematických regresí.

  1. jednoduchá regrese - predikce jedné proměnné další jedno proměnnou
  2. mnohonásobná regrese - predikce jedné proměnné pomocí více proměnných
  3. lineární regrese - rovnice daná součtem násobků jedné proměnné
  4. log-lineární regrese - predikuje kvantitativní proměnnou na základě kvalitativní proměnné - zařazeno napříkald pozorování pro zlepšení odhadu

22

jaké uvádět statistiky centrální tendence?

  1. průměr - pokud rozložení není příliš šikmé
  2. modus - pokud je křivka multimodální
  3. medián - pokud je křivka šikmá a unimodální

23

Jak převedu Z skór na hrubý skór?

Musím znát hodnotu směrodatné odhcylky a průměru.

m = 100; s = 15

Spočítejte pro osobu Z = -3 IQ.

X = Z x s + m = -3 x 15 + 100 = 55

24

Co je to centrální limitní teorém?

Pro každou populaci o průměru μ a směrodatné odchylce σ se bude rozdělení výběrových průměrů výběru (pro rozsah výběru jdoucí do nekonečna) blížit normálnímu rozložení s průměrem m a směrodatnou odchylkou σx = σ√n.

25

Co znamená mnohonásobná porovnání u ANOVA?

F statistika řekne, že existuje rozdíl mezi skupinami, ale neřekne mezi kterými. Je tedy potřeba provést multiple comparison nebo post-hoc test.

Jsou to v podtsatě upravené t testy

Fisherův LSD test, Bonferoniho test, Tukeyho test, Schefeho test...

Upravují hladinu významnosti -Fisherův LSD test je liberálnější, naopak ostatní testy jsou přísnější.

26

Míry založené na chí-kvadrátu.

Fí koeficient - užívá se pro 2x2 design v dichotomických otázkách (napříkald pohlaví) - hodnota X2 se vydělí počtem osob a výsledek se odmocní

Cramerovo V - podobně jako Fí; počet osob se navíc násobí početem řádků -1< používá se na věší deisgny

27

Co ovlivňuje statistickou sílu? Power statistics.

  1. hladina významnosti
  2. síla testu
  3. velikost účinku
  4. rozsah výběrového vzorku

- pokud známe alepsoň tři z nich, dá se dopočítat zbývající porametr

28

Co znamená velikost účinku?

Čím je rozdíl mezi populačními průměry vyšší, tím větší je pravděpodobnost, že najdeme i rozdíl mezi průměry vzorků.

29

Požadovaná velikost vzorku?

Nejprve se rozhodnu,  jaký nejmenší účinke pokládám za klinicky významný.

Často se počítá Cohenův koeficient účinku d - označuje se jako effect size

d < 0,20 = malý účinek (r = 0,10)

d = 0,50 = střední (r = 0,243)

d > 0,80 = velký (r = 0,371)

Vše ovšem závisí na kontextu, musíme odhadnout i variabilitu znaku v populaci σ (z předchozích studií, z pilotáže...), stanovit hladinu významnosti (obvykle a = 0,05) a nakonec sílu testu (mion. 90%) - jakou chceme mít pravděpodobnost, že pokud rozdíl existuje, že ho prokážeme?