Меры центральной тенденции Flashcards

(21 cards)

1
Q

Зачем нужна гистограмма частот?

A

Гистограмма позволяет сформировать первое впечатление какая форма распределения нашего количественного признака

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

В чем суть симметричного распределения?

A

Количественная переменная расположена симметрично на графике так как большинство всех наблюдений оказались в центре нашего распределения и чем дальше мы отклоняемся в право или в лево от середины распределения - тем реже встречаются значения нашего признака

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

В чем суть ассиметричного распределения?

A

Чем большее или меньшее значение принимает переменная Х тем реже она встречается

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Какие есть типы описательной статистики?

A
  1. Меры центральной тенденции

1. Меры изменчивости

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

На какие вопросы отвечают меры центральной тенденции?

A

Насколько в принципе высокие значения принимает наша перемененная

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Для чего нужны меры изменьчивости?

A

Для того чтобы описать вариативность нашего признака

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Какие бывают моды центральной тенденции?

A
  1. Мода
  2. Медиана
  3. Среднее значение
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Что такое мода(Mode) и что делать когда их несколько?

A

Это значение изменяемого признака, которое встречается максимально часто.
На практике может быть как одна так и несколько мод.
Тогда говориться что в распределении есть несколько мод

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Что такое медиана(median) и как ее рассчитать?

A

Это значение признака, которое делит упорядоченное множество данных пополам.
Для того чтобы получить медиану, список значений нужно записать их по возрастанию и затем разделить упорядоченное количество признаков - пополам.
В случае если количество элементов четное - тогда нужно взять два центральных значения и вычислить среднее по ним

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Что такое среднее значение?

A

Сумма всех значений признака разделенного на количество изменений

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Какая разница в отображение символа среднего значения для ГС и выборки?

A

Среднее значение выборки отображается как Х с чертой, а среднее значение генеральной выборки как символ “Мю”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Как понять какую меру центральной тенденции нужно использовать?

A
  1. Можно использовать любую из мер если:
    1) распределения - только одна мода
    2) нет выбросов
  2. Нужно использовать моду или медиану для того чтобы охарактеризовать степень выраженности количественного признака если есть:
    1) асимметрия
    2) выбросы
    3) несколько мод
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Какие есть свойства среднего значения?

A

Свойство 1: если к каждому значению нашей выборки прибавить определенное чисто, то среднее число так же увеличиться на данное чисто
Свойство 2: если каждое значению нашей выборки умножить на определенное чисто, то среднее число так же увеличиться на данное чисто
Свойство 3: если для каждого значения нашей выборки рассчитаем такой показатель как его отклонение от среднего арифметического, то сумма этих отклонений будет равна нулю

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Какие бывает меры изменчивости?

A
  1. Размах (Range)

2. Дисперсия (variance)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Что такое размах и какие его недостатки?

A

Это разница между максимальным и минимальным значением.
Из недостатков это то что любое малейшее изменение одного их крайних значений - будет очень болезненно ощущаться в результате (в случае выброса), при этом вариативность признака особе не меняется.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Что такое дисперсия?

A

Это средний квадрат отклонений индивидуальных значений признака от их средней величины

Это показывает насколько в среднем наши значения отклоняются от среднего значения по выборки

17
Q

Какие особенности расчета дисперсии для ГС?

A

Так как для того чтобы получить значение дисперсии по ГС мы возвели значения в квадрат из-за чего дисперсия будет превышать реальное среднее отклонение наших наблюдений от среднего по выборки.
Для того чтобы вернуться к исходному значению среднего отклонения наших наблюдений от среднего по выборки необходимо рассчитать “Сигму” или средне квадратическое отклонение

18
Q

В чем разница отображения символов среднеквадратического отклонения?

A

Для отображения среднеквадратического отклонения по:

1) ГС - используется “сигма”
2) Выборки - используется

19
Q

Как рассчитывается дисперсия по выборке?

A

Разница только в том что в знаменателе отнимается единица.
Это действие связано с таким понятием как “степень свободы”
Если мы хотим основываясь на нашей выборке, оценить какая дисперсия в ГС, то мы будем получать более точные оценки если будем немного корректировать нашу формулу вычитая минус один в знаменателе

20
Q

Как рассчитать стандартное отклонение?

21
Q

Какие есть свойства у дисперсии и стандартного отклонения?

A

Свойство 1: Если к каждому наблюдению нашей выборки прибавим число - то значение дисперсии и отклонения не изменяться и не будет отличаться от предыдущего значения.
То есть среднее смещается, а само распределение остается тем же

Свойство 2: Если каждое наблюдение нашей выборки умножим на число - то значение дисперсии и отклонения увеличатся на данное чисто тем самым увеличится распределение без смещения