КЕФИР
Рубрикатор Всякости

Средний среднему рознь

Ложь, ложь, не, туда не ложь, сюда ложь. И статистика. Рассказ про то, как Марк Иваныч читал газету за завтраком.

Словечки

Mean, Average, Median, Mode, Harmonic mean, Geometric Mean, Root Mean Square

Ситуация

Ничто так не бодрит по утрам, как новый номер ПТУНа

Марк Иванович любит читать еженедельную газету ПТУН по утрам. ПТУН - правда только у нас. Вот заголовки последнего номера:

Средняя зарплата в Pupsiks Inc. составляет сто-пицот тысяч рублей!

50% учеников написали экзамены хуже среднего! Нация стремительно глупеет!

Сенсация! Огурцы убивают! Британские ученые подтвердили, что по статистике, 100% людей, кто употребляет огурцы умирают.

Сразу захотелось и в Pupsics Inc. пойти трудиться, и поругаться на цифровую псевдодебильность, и в срочном порядке избавиться от огурцов. Проблема только в том, что действия, которые Марк Иваныч захотел предпринять, не принесут особого профита.

Снова обманули

Давайте поможем дяде Марку разобраться со средними, чтобы он больше на такие заголовки не попадался.

Pupsics Inc.

Сначала заглянем в Pupsics Inc. и попросим данные о зарплате работников:

Намба Имя Должность Зарплата
1 Иван Иванович Пупсиков Главный по тарелочкам 500 000
2 Алексей Антонович Поручайкин Следитель 200 000
3 Анна Андреевна Посчитайкина Главный Считатель 100 000
4 Павел Петрович Работяжкин Главный Чинитель 50 000
5 Елена Павловна Гайкина Главный Крутитель 50 000
6 Иван Евгеньевич Копитанчиков Копатель 25 000
7 Николай Петрович Работяжкин Носитель 25 000
8 Николай Иванович Чинный Чинитель 25 000
9 Сан Саныч Санкин Крутитель 25 000
10 Петя Попугайчиков Поди-принесист 5 000

В газете писали, что средняя зарплата должна быть 100 500. Надо бы проверить. Что делаем? Считаем среднюю зарплату в Pupsics Inc.

Среднее значение

Прикол в том, что Среднее значение (Average) зарплаты можно считать по-разному. То, что мы обычно подразумеваем, когда говорим "средняя зарплата" - это Среднее арифметическое (Mean). Давайте посмотрим на несколько способов.

Среднее арифметическое

Среднее арифметическое (Mean) считается просто. Спрашиваем зарплаты, складываем зарплаты, делим сумму на количество тех, у кого спросили. Можно выпендриться и по-математически записать:

$$M = \frac{1}{N}\sum_{i=1}^{N}{x_i}$$

Чего за колябушки? Тык

\(N\) - это количество работничков на предприятии. В нашем случае \(N=10\). \(x_i\) - это зарплата работничка под номером \(i\). Например, \(x_8=\) 25 000.

Достаём калькуляторы. Тем, кто любит хардкор, можно не доставать. Тэк, у меня получилось 100 500. Не соврали, однако. Одна заковырка - на работу только копателей и таскателей зовут. Эх, пищаль.

Больше не попадаться на уловки ПТУНа Маркиванычу помогут Мода (Mode) и Медиана (Median).

Мода

Мода (Mode) - это почти так же модно, как носки с сандалиями. Мода - это самый часто встречающийся элемент. Посмотрим на цифири:

\(\{1, 3, 2, 3, 4, 3, 1, 1, 2, 4\}\)

\(1\) тут три раза встречается, а \(2\) и \(4\) - по два раза. Поэтому \(1\) - это мода этих цифирь.

Хто-то очень умный может заметить, что таких элементов может быть несколько. Тут \(1\) и \(3\) по-три раза встречаются. Умным на это отвечают: "Чего ты прикопался, а? Совокупность мультимодальна. И всё тут."

В Pupsiks Inc. самая модная зарплата - 25 000. Самую модную зарплату тоже можно назвать средней зарплатой. Средняя зарплата в Pupsics Inc. - 25 000. Розовые очки протёрли грязной тряпочкой.

Медиана

Медиана (Median) - это такой типичный средний товарищ. Половина людей, о которых он слышал - это сыновья маминых подруг, а для другой половины он и есть сын маминой подруги. Снова к цифирям:

\(\{1, 3, 4, 7, 11, 23, 33\}\)

Три числа меньше, чем \(7\), три числа - больше. \(7\) - это и есть медиана.

Тут есть одна проблемка. Что если чисел будет чётное количество? Не получится выбрать число так, что половина оставшихся чисел больше этого числа, а другая половина - меньше. В этом случае мы делаем Мегазорда. Берём два числа, похожих на медиану и находим их полусумму. То ись, складываем эти числа, а сумму делим пополам.

\(\{1, 3, 4, 8, 11, 23\}\)

\(4\) и \(8\) - это кандидаты в Мегазорды. Медиана получилась равна \(\frac{4 + 8}{2} = 6\).

В Pupsiks Inc. чётное количество сотрудников. Придётся делать Мегазорда. Медианная зарплата - 37 500. Медианную зарплату тоже можно назвать средней зарплатой. Средняя зарплата в Pupsics Inc. - 37 500. Нууу, лучше чем Мода, но не Среднее арифметическое, точно.

Я узнал, что у меня...

На самом деле, Среднее арифметическое - это частный случай. Среднее Степенное (Generalized mean) - вот это общий случай. Название на английском как-бы намекает.

$$M_p = (\frac{1}{N}\sum_{i=1}^{N}{x_i^p})^{\frac{1}{p}}$$

Популярные представители этого семейства:

Выводы

Среднее значение посчитать можно по-разному. Каждый способ может по-своему пригодиться. Марку Иванычу дадим совет:

В следующий раз просите всех средних