Меры центральной тенденции Flashcards
(21 cards)
Зачем нужна гистограмма частот?
Гистограмма позволяет сформировать первое впечатление какая форма распределения нашего количественного признака
В чем суть симметричного распределения?
Количественная переменная расположена симметрично на графике так как большинство всех наблюдений оказались в центре нашего распределения и чем дальше мы отклоняемся в право или в лево от середины распределения - тем реже встречаются значения нашего признака
В чем суть ассиметричного распределения?
Чем большее или меньшее значение принимает переменная Х тем реже она встречается
Какие есть типы описательной статистики?
- Меры центральной тенденции
1. Меры изменчивости
На какие вопросы отвечают меры центральной тенденции?
Насколько в принципе высокие значения принимает наша перемененная
Для чего нужны меры изменьчивости?
Для того чтобы описать вариативность нашего признака
Какие бывают моды центральной тенденции?
- Мода
- Медиана
- Среднее значение
Что такое мода(Mode) и что делать когда их несколько?
Это значение изменяемого признака, которое встречается максимально часто.
На практике может быть как одна так и несколько мод.
Тогда говориться что в распределении есть несколько мод
Что такое медиана(median) и как ее рассчитать?
Это значение признака, которое делит упорядоченное множество данных пополам.
Для того чтобы получить медиану, список значений нужно записать их по возрастанию и затем разделить упорядоченное количество признаков - пополам.
В случае если количество элементов четное - тогда нужно взять два центральных значения и вычислить среднее по ним
Что такое среднее значение?
Сумма всех значений признака разделенного на количество изменений
Какая разница в отображение символа среднего значения для ГС и выборки?
Среднее значение выборки отображается как Х с чертой, а среднее значение генеральной выборки как символ “Мю”
Как понять какую меру центральной тенденции нужно использовать?
- Можно использовать любую из мер если:
1) распределения - только одна мода
2) нет выбросов - Нужно использовать моду или медиану для того чтобы охарактеризовать степень выраженности количественного признака если есть:
1) асимметрия
2) выбросы
3) несколько мод
Какие есть свойства среднего значения?
Свойство 1: если к каждому значению нашей выборки прибавить определенное чисто, то среднее число так же увеличиться на данное чисто
Свойство 2: если каждое значению нашей выборки умножить на определенное чисто, то среднее число так же увеличиться на данное чисто
Свойство 3: если для каждого значения нашей выборки рассчитаем такой показатель как его отклонение от среднего арифметического, то сумма этих отклонений будет равна нулю
Какие бывает меры изменчивости?
- Размах (Range)
2. Дисперсия (variance)
Что такое размах и какие его недостатки?
Это разница между максимальным и минимальным значением.
Из недостатков это то что любое малейшее изменение одного их крайних значений - будет очень болезненно ощущаться в результате (в случае выброса), при этом вариативность признака особе не меняется.
Что такое дисперсия?
Это средний квадрат отклонений индивидуальных значений признака от их средней величины
Это показывает насколько в среднем наши значения отклоняются от среднего значения по выборки
Какие особенности расчета дисперсии для ГС?
Так как для того чтобы получить значение дисперсии по ГС мы возвели значения в квадрат из-за чего дисперсия будет превышать реальное среднее отклонение наших наблюдений от среднего по выборки.
Для того чтобы вернуться к исходному значению среднего отклонения наших наблюдений от среднего по выборки необходимо рассчитать “Сигму” или средне квадратическое отклонение
В чем разница отображения символов среднеквадратического отклонения?
Для отображения среднеквадратического отклонения по:
1) ГС - используется “сигма”
2) Выборки - используется
Как рассчитывается дисперсия по выборке?
Разница только в том что в знаменателе отнимается единица.
Это действие связано с таким понятием как “степень свободы”
Если мы хотим основываясь на нашей выборке, оценить какая дисперсия в ГС, то мы будем получать более точные оценки если будем немного корректировать нашу формулу вычитая минус один в знаменателе
Как рассчитать стандартное отклонение?
Какие есть свойства у дисперсии и стандартного отклонения?
Свойство 1: Если к каждому наблюдению нашей выборки прибавим число - то значение дисперсии и отклонения не изменяться и не будет отличаться от предыдущего значения.
То есть среднее смещается, а само распределение остается тем же
Свойство 2: Если каждое наблюдение нашей выборки умножим на число - то значение дисперсии и отклонения увеличатся на данное чисто тем самым увеличится распределение без смещения