Средний среднему рознь
Ложь, ложь, не, туда не ложь, сюда ложь. И статистика. Рассказ про то, как Марк Иваныч читал газету за завтраком.
Словечки
Ситуация
Марк Иванович любит читать еженедельную газету ПТУН по утрам. ПТУН - правда только у нас. Вот заголовки последнего номера:
Средняя зарплата в Pupsiks Inc. составляет сто-пицот тысяч рублей!
50% учеников написали экзамены хуже среднего! Нация стремительно глупеет!
Сенсация! Огурцы убивают! Британские ученые подтвердили, что по статистике, 100% людей, кто употребляет огурцы умирают.
Сразу захотелось и в Pupsics Inc. пойти трудиться, и поругаться на цифровую псевдодебильность, и в срочном порядке избавиться от огурцов. Проблема только в том, что действия, которые Марк Иваныч захотел предпринять, не принесут особого профита.
Давайте поможем дяде Марку разобраться со средними, чтобы он больше на такие заголовки не попадался.
Pupsics Inc.
Сначала заглянем в Pupsics Inc. и попросим данные о зарплате работников:
Намба | Имя | Должность | Зарплата |
1 | Иван Иванович Пупсиков | Главный по тарелочкам | 500 000 |
2 | Алексей Антонович Поручайкин | Следитель | 200 000 |
3 | Анна Андреевна Посчитайкина | Главный Считатель | 100 000 |
4 | Павел Петрович Работяжкин | Главный Чинитель | 50 000 |
5 | Елена Павловна Гайкина | Главный Крутитель | 50 000 |
6 | Иван Евгеньевич Копитанчиков | Копатель | 25 000 |
7 | Николай Петрович Работяжкин | Носитель | 25 000 |
8 | Николай Иванович Чинный | Чинитель | 25 000 |
9 | Сан Саныч Санкин | Крутитель | 25 000 |
10 | Петя Попугайчиков | Поди-принесист | 5 000 |
В газете писали, что средняя зарплата должна быть 100 500. Надо бы проверить. Что делаем? Считаем среднюю зарплату в Pupsics Inc.
Среднее значение
Прикол в том, что Среднее значение (Average) зарплаты можно считать по-разному. То, что мы обычно подразумеваем, когда говорим "средняя зарплата" - это Среднее арифметическое (Mean). Давайте посмотрим на несколько способов.
Среднее арифметическое
Среднее арифметическое (Mean) считается просто. Спрашиваем зарплаты, складываем зарплаты, делим сумму на количество тех, у кого спросили. Можно выпендриться и по-математически записать:
$$M = \frac{1}{N}\sum_{i=1}^{N}{x_i}$$
Чего за колябушки? Тык
\(N\) - это количество работничков на предприятии. В нашем случае \(N=10\). \(x_i\) - это зарплата работничка под номером \(i\). Например, \(x_8=\) 25 000.
Достаём калькуляторы. Тем, кто любит хардкор, можно не доставать. Тэк, у меня получилось 100 500. Не соврали, однако. Одна заковырка - на работу только копателей и таскателей зовут. Эх, пищаль.
Больше не попадаться на уловки ПТУНа Маркиванычу помогут Мода (Mode) и Медиана (Median).
Мода
Мода (Mode) - это почти так же модно, как носки с сандалиями. Мода - это самый часто встречающийся элемент. Посмотрим на цифири:
\(\{1, 3, 2, 3, 4, 3, 1, 1, 2, 4\}\)
\(1\) тут три раза встречается, а \(2\) и \(4\) - по два раза. Поэтому \(1\) - это мода этих цифирь.
Хто-то очень умный может заметить, что таких элементов может быть несколько. Тут \(1\) и \(3\) по-три раза встречаются. Умным на это отвечают: "Чего ты прикопался, а? Совокупность мультимодальна. И всё тут."
В Pupsiks Inc. самая модная зарплата - 25 000. Самую модную зарплату тоже можно назвать средней зарплатой. Средняя зарплата в Pupsics Inc. - 25 000. Розовые очки протёрли грязной тряпочкой.
Медиана
Медиана (Median) - это такой типичный средний товарищ. Половина людей, о которых он слышал - это сыновья маминых подруг, а для другой половины он и есть сын маминой подруги. Снова к цифирям:
\(\{1, 3, 4, 7, 11, 23, 33\}\)
Три числа меньше, чем \(7\), три числа - больше. \(7\) - это и есть медиана.
Тут есть одна проблемка. Что если чисел будет чётное количество? Не получится выбрать число так, что половина оставшихся чисел больше этого числа, а другая половина - меньше. В этом случае мы делаем Мегазорда. Берём два числа, похожих на медиану и находим их полусумму. То ись, складываем эти числа, а сумму делим пополам.
\(\{1, 3, 4, 8, 11, 23\}\)
\(4\) и \(8\) - это кандидаты в Мегазорды. Медиана получилась равна \(\frac{4 + 8}{2} = 6\).
В Pupsiks Inc. чётное количество сотрудников. Придётся делать Мегазорда. Медианная зарплата - 37 500. Медианную зарплату тоже можно назвать средней зарплатой. Средняя зарплата в Pupsics Inc. - 37 500. Нууу, лучше чем Мода, но не Среднее арифметическое, точно.
Я узнал, что у меня...
На самом деле, Среднее арифметическое - это частный случай. Среднее Степенное (Generalized mean) - вот это общий случай. Название на английском как-бы намекает.
$$M_p = (\frac{1}{N}\sum_{i=1}^{N}{x_i^p})^{\frac{1}{p}}$$
Популярные представители этого семейства:
- \( M_{-1}\) - Среднее гармоническое. (Harmonic mean) "Пусть-бегут" играть не умеет, но помогает всякого посчитать. Например среднюю скорость.
- \( M_{0}\) - Среднее геометрическое (Geometric mean). С помощью формулки выше его так просто не посчитать. АААА НОЛЬ В ЗНАМИНАТИЛЕ!1!11. С пределами придётся повозиться. Его часто используют, когда хотят посчитать темпы роста баблишка.
- \( M_{1}\) - Среднее арифметическое. Знакомы уже.
- \( M_2\) - Среднее квадратическое. Ещё его ласково называют "рэ мэ сэ" (Root Mean Square). С RMS знакомы дата саентисты.
Выводы
Среднее значение посчитать можно по-разному. Каждый способ может по-своему пригодиться. Марку Иванычу дадим совет:
В следующий раз просите всех средних