Статистика повторение базы Flashcards

(33 cards)

1
Q

что такое меры центральной тенденции

A

моде медиана среднее

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

что показывает стандартное отклонение?

A

оно показывает насколько В СРЕДНЕМ данные отклоняются от среднего (математического ожидания)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

какими бывают теоретические распределения вероятностей?

A

непрерывными (ех: нормальное) и дискретными (ех: биномиальное)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

что такое стандартное распределение?

A

Z-распределение - это распределение, у которого среднее равно 0, а стандартное отклонение равно 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

из чего и как можно получить стандартное распределение?

A

стандартное распределение можно получить из любого нормального распределения, путем стандартизации. для этого мы из переводим все значения в Z-значения - из каждого значения вычитаем среднее и делим на стандартное отклонение

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

как записать генеральную совокупность со средним 100 и стандартным отклонением 5?

A

~N(100,5)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

биномиальное распределение описывает какие данные?

A

дискретные данные, которые могут принимать 2 значения

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

что такое процесс Бернулли?

A

это серия независимых испытаний

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

допустим мы взяли из нормального распределения со средини 100 и стандартным отклонением 5 число 105. как будет выглядеть его Z-занчени?

A

(105-100)/5=1
это говорит о том, что число 105 отличается от среднего на одно стандартное отклонение

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

какие пять свойств есть у нормального распределения?

A
  • непрерывность значений (это не целые числа)
  • симметричность
  • унимодальность
  • площадь под кривой равна 1
  • меры центральной тенденции (мода, медиана, и средняя) равны между собой
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

что гласит эмпирическое правило для любого нормального распределения?

A

• около 68% данных находятся в интервале ± одно стандартное отклонение от среднего;
• около 95% данных находятся в интервале ± два стандартных отклонения от среднего;
• около 99% данных находятся в интервале ± три стандартных отклонения от среднего.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

каким требованиям должны удовлетворять данные биномиального распределения?

A

величина (результат испытания) может принимать только два взаимоисключающих значения

вероятность исхода каждого испытания не зависима от исходов других испытаний

вероятность положительного исхода равна p и одинакова для всех испытаний

количество испытаний (выборка) определено и обозначается буквой n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Формула для биномиального распределения что показывает? и какова она сама?

A

Формула биномиального распределения показывает вероятность получения определенного (k) количества успехов в фиксированном числе (n) независимых испытаний, где вероятность успеха в каждом испытании постоянна.
Pk = C(n k) * p^k * (1-p)^(n-k)
C(n k) = n! / (k!(n - k)!)
p — вероятность успеха
n — число испытаний
k — число успехов

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Формула для вычисления вероятности сочетания событий

A

C(n k) = n! / (k!(n - k)!)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

что такое сочетание

A

Это число способов выбрать число k из n объектов, если порядок не важен

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Среднее для генеральной совокупности

A

μ = Σ xi * (1 / N) (i = 1 to N)

17
Q

Дисперсия для генеральной совокупности

A

σ² = Σ (xi - μ)² * (1 / N)
σ² — дисперсия
N — объём генеральной совокупности
xi — отдельные значения
μ — среднее генеральной совокупности

18
Q

Стандартное отклонение
как на английском?
формула?
что показывает?
чем оно больше, тем что?
В каких единицах измеряется?
что известно для 2х и 3х SD

A

σ = √[ (1 / N) × Σ (xi - μ)² ]
- (SD)
- Это мера, которая показывает, насколько данные разбросаны вокруг среднего значения.
- Чем больше стандартное отклонение, тем больше разброс данных.
- Измеряется в тех же единицах, что и сами данные.
- Используется для описания изменчивости внутри выборки или набора данных.

  • 68% наблюдений отклоняется на ОДНО стандартное отклонение от среднего
  • 95% наблюдений отклоняется на ДВА стандартное отклонение от среднего
19
Q

Функция нормального распределения

A

f(x) = e^(-(x - μ)² / (2σ²)) * (1 / (σ√(2π)))

20
Q

Me

A
  • (медиана) = 50 перцентиль)
    1) упорядочить ряд чисел 2) взять медианное число 3) Если длина массива четная, берем два элемента посередине и считаем их среднее арифметическое
  • половина элементов массива больше либо равна ей, а другая половина элементов — меньше либо равна
21
Q

что такое 95-процентиль

A

это такое число для которого 95% массива либо равно этому числу, либо больше его

22
Q

как проверяют на нормальность

A
  • для нормального распределение есть известное соотношение между процентилем и отклонением от среднего
  • например, 50й процентиль (=медиана) равен среднему генеральной совокупности
  • 16 и 84 процентили = среднее +- стандартное отклонение
  • если эти соотношения не совпадают, что распределение не нормальное
  • кроме того, можно расчитать 25й и 75й процентиль и медиану. если медиана располагается ближе к одному из этих процентилей чем к другому, то распределение несимметрично и не нормально
23
Q

Среднее для выборки (=выборочное среднее)

A

x̄ = (1 / n) × Σ xi

24
Q

как понять, что выборочное среднее хорошо отражает генеральную совокупность?

A

можно рассчитать стандартную ошибку среднего

25
Стандартная ошибка
- (SE): - Это мера, которая показывает, насколько выборочное среднее может отличаться от истинного среднего значения совокупности. - В основном используется при оценке среднего значения совокупности на основе выборочного среднего. - Чем меньше стандартная ошибка, тем точнее оценка среднего значения совокупности. - Стандартная ошибка вычисляется как стандартное отклонение, разделенное на квадратный корень из размера выборки. - стандартная ошибка среднего
26
центральная предельная теорема
- выборочные средние извлеченные из генеральной совокупности будут распределены приблизительно нормально, и при этом это не зависит от распределения самой генеральной совокупности из которой их извлекли - среднее выборочных средних равна среднему генеральной совокупности - стандартная ошибка среднего - это стандартное отклонение всех возможных выборочных средних, которая зависит от зависит от стандартного отклонения совокупности и от объема выборки
27
в чем разница между стандартным отклонением и стандартной ошибкой среднего?
- стандартное отклонение (SD) считается в некой выборке, а стандартная ошибка среднего (SE) – это подсчет стандартного отклонения для выборочных средних
28
Исследователь, обследовав выборку из 20 человек, написал в статье, что средний сердечный выброс составлял 5,0 л/мин со стандартным отклонением 1 л/мин. Какое минимальное и максимальное значение составил сердечный выброс для 95% людей?
мы знаем, что одно стандартное отклонение вмещает 68% выборки, два стандартных отклонения - 95%. из этого мы понимаем, что ответ 5 +- 2, то есть с 3 до 7л/мин
29
Исследователь, обследовав выборку из 20 человек, написал “сердечный выброс составил 5,0 ± 0,22 л/мин”. И он указал стандартную ошибку среднего. Какое минимальное и максимальное значение составил сердечный выброс для 95% людей?
стандартная ошибка среднего = среднеквадратическое отклонение / корень из объема выборки. следовательно 5±0,22*(корень из 20)
30
что такое параметрические методы?
это методы, в основе которых лежит допущение о распределении данных в генеральной совокупности, из которой происходит анализируемая выборка
31
что делать, если мы видим, что наши данные распределены не нормально?
1) использовать непараметрические методы, в основе которых лежит меньше допущений о распределении данных 2) преобразовать наше ненормальное распределение в нормальное
32
как проверить, нормально ли распределены наши данные?
1) построить график и посмотреть 2) провести тесты Колмагорова-Смирнова и Андерсона-Дарлинга
33