Статистика повторение базы Flashcards
(33 cards)
что такое меры центральной тенденции
моде медиана среднее
что показывает стандартное отклонение?
оно показывает насколько В СРЕДНЕМ данные отклоняются от среднего (математического ожидания)
какими бывают теоретические распределения вероятностей?
непрерывными (ех: нормальное) и дискретными (ех: биномиальное)
что такое стандартное распределение?
Z-распределение - это распределение, у которого среднее равно 0, а стандартное отклонение равно 1
из чего и как можно получить стандартное распределение?
стандартное распределение можно получить из любого нормального распределения, путем стандартизации. для этого мы из переводим все значения в Z-значения - из каждого значения вычитаем среднее и делим на стандартное отклонение
как записать генеральную совокупность со средним 100 и стандартным отклонением 5?
~N(100,5)
биномиальное распределение описывает какие данные?
дискретные данные, которые могут принимать 2 значения
что такое процесс Бернулли?
это серия независимых испытаний
допустим мы взяли из нормального распределения со средини 100 и стандартным отклонением 5 число 105. как будет выглядеть его Z-занчени?
(105-100)/5=1
это говорит о том, что число 105 отличается от среднего на одно стандартное отклонение
какие пять свойств есть у нормального распределения?
- непрерывность значений (это не целые числа)
- симметричность
- унимодальность
- площадь под кривой равна 1
- меры центральной тенденции (мода, медиана, и средняя) равны между собой
что гласит эмпирическое правило для любого нормального распределения?
• около 68% данных находятся в интервале ± одно стандартное отклонение от среднего;
• около 95% данных находятся в интервале ± два стандартных отклонения от среднего;
• около 99% данных находятся в интервале ± три стандартных отклонения от среднего.
каким требованиям должны удовлетворять данные биномиального распределения?
величина (результат испытания) может принимать только два взаимоисключающих значения
вероятность исхода каждого испытания не зависима от исходов других испытаний
вероятность положительного исхода равна p и одинакова для всех испытаний
количество испытаний (выборка) определено и обозначается буквой n
Формула для биномиального распределения что показывает? и какова она сама?
Формула биномиального распределения показывает вероятность получения определенного (k) количества успехов в фиксированном числе (n) независимых испытаний, где вероятность успеха в каждом испытании постоянна.
Pk = C(n k) * p^k * (1-p)^(n-k)
C(n k) = n! / (k!(n - k)!)
p — вероятность успеха
n — число испытаний
k — число успехов
Формула для вычисления вероятности сочетания событий
C(n k) = n! / (k!(n - k)!)
что такое сочетание
Это число способов выбрать число k из n объектов, если порядок не важен
Среднее для генеральной совокупности
μ = Σ xi * (1 / N) (i = 1 to N)
Дисперсия для генеральной совокупности
σ² = Σ (xi - μ)² * (1 / N)
σ² — дисперсия
N — объём генеральной совокупности
xi — отдельные значения
μ — среднее генеральной совокупности
Стандартное отклонение
как на английском?
формула?
что показывает?
чем оно больше, тем что?
В каких единицах измеряется?
что известно для 2х и 3х SD
σ = √[ (1 / N) × Σ (xi - μ)² ]
- (SD)
- Это мера, которая показывает, насколько данные разбросаны вокруг среднего значения.
- Чем больше стандартное отклонение, тем больше разброс данных.
- Измеряется в тех же единицах, что и сами данные.
- Используется для описания изменчивости внутри выборки или набора данных.
- 68% наблюдений отклоняется на ОДНО стандартное отклонение от среднего
- 95% наблюдений отклоняется на ДВА стандартное отклонение от среднего
Функция нормального распределения
f(x) = e^(-(x - μ)² / (2σ²)) * (1 / (σ√(2π)))
Me
- (медиана) = 50 перцентиль)
1) упорядочить ряд чисел 2) взять медианное число 3) Если длина массива четная, берем два элемента посередине и считаем их среднее арифметическое - половина элементов массива больше либо равна ей, а другая половина элементов — меньше либо равна
что такое 95-процентиль
это такое число для которого 95% массива либо равно этому числу, либо больше его
как проверяют на нормальность
- для нормального распределение есть известное соотношение между процентилем и отклонением от среднего
- например, 50й процентиль (=медиана) равен среднему генеральной совокупности
- 16 и 84 процентили = среднее +- стандартное отклонение
- если эти соотношения не совпадают, что распределение не нормальное
- кроме того, можно расчитать 25й и 75й процентиль и медиану. если медиана располагается ближе к одному из этих процентилей чем к другому, то распределение несимметрично и не нормально
Среднее для выборки (=выборочное среднее)
x̄ = (1 / n) × Σ xi
как понять, что выборочное среднее хорошо отражает генеральную совокупность?
можно рассчитать стандартную ошибку среднего