М-р Гисмо. 200 долларов в неделю— это так называемая мода, то есть заработок большинства сотрудников нашей фирмы.
М-р Гисмо. Ваша беда в том, мой друг, что вы не знаете, чем отличается среднее от медианы и моды.
Сэм. Отчего же? Теперь я отлично знаю это. Ищите себе других простачков!
Статистические утверждения могут быть весьма парадоксальными, а иногда даже вводить в заблуждение. История о фабрике мистера Гисмо показывает общий источник недоразумений — различие между средним, медианой и модой.
Слово «среднее» мы обычно понимаем как синоним «среднего арифметического». Среднее — ценный статистический показатель. Но если имеются большие выбросы, например суммы, еженедельно получаемые мистером Гисмо и его братом, то «средний» заработок может давать ложное представление об истинном положении дел.
Нетрудно привести и другие примеры того, как утверждения о «средних» способны вводить в заблуждение. Так, в заметке репортера одной из газет сообщалось о человеке, утонувшем в реке, глубина которой «в среднем» едва достигает полуметра. Создается впечатление, будто человек утонул на мелководье.
Печальное происшествие утрачивает всю загадочность после того, как вы узнаете, что человек утонул в одном из мест, где глубина превышает 3 м.
Некая корпорация сообщает, будто ее деятельность демократично контролируется общим собранием 143 держателей акций, так как на 50 держателей приходится 600 голосов, что составляет в среднем по 12 голосов па 1 держателя акций. Но если каждый из 45 держателей акций имеет лишь по 4 голоса, а 5 избранных имеют по 84 голоса, то среднее число голосов на одного держателя акций по-прежнему составляет 12 голосов, хотя пятерка избранных полностью заправляет всей деятельностью корпорации.
Еще один пример. Желая привлечь в город фирмы, занимающиеся розничной продажей товаров, торговая палата выступает в печати с заявлением о необычайно высоком среднем уровне доходов на душу населения.
Большинство людей, прочитав в газете это заявление, делают вывод, что жители города извлекают из своего рода деятельности большие доходы. Но если среди жителей города окажется лишь один миллиардер, то даже если все остальное население будет получать малые доходы, средний доход на душу населения по-прежнему останется высоким.
Иногда под «средним» понимают не среднее арифметическое, а медиану или моду, что приводит к еще большим недоразумениям. Если значения расположить в порядке возрастания или убывания, то медиана — это значение, стоящее в середине. Если число значений нечетно, то медиана — это значение, равноудаленное от концов такого упорядоченного списка. Если число значений четно, то за медиану обычно принимают среднее арифметическое двух значений, стоящих в середине.
Для Сэма медиана была бы полезнее, чем среднее арифметическое, но даже медиана дает искаженную картину истинного распределения доходов среди служащих фирмы. В действительности Сэму необходимо знать моду — значение, наиболее часто встречающееся в списке данных. На фабрике мистера Гисмо мода — это зарплата, выплачиваемая большему числу сотрудников, чем любая другая зарплата. Иногда моду называют «типичным случаем», так как она встречается чаще других. В нашем последнем примере «типичная» семья в городе (та, чьи доходы служат модой) может быть очень бедной, хотя средний доход горожан очень велик из-за небольшого числа весьма состоятельных жителей.
«Мать года»
В конце года жена Сэма получила особый приз от мэра города и почетный титул «матери года».
Местная газета поместила фотографию Сэма, его жены и 13 их детей.
Редактору очень понравился снимок. Он вызвал к себе фотографа.
Редактор. Отличная работа, Баском! Мне пришла в голову новая идея. Снимите-ка мне теперь семью, где бы число детей было средним по нашему городу.
Новое задание редактора оказалось невыполнимым. Почему? Да потому, что ни в одной семье число детей не совпадало со средним!
Среднее число детей было равно 21/2
Еще одно широко распространенное заблуждение, связанное со «средним», — убеждение, будто среднее непременно должно существовать. После того как из нашего рассказа в картинках вы узнали о том, что среднее число детей, приходящихся на одну семью, может быть равным 21/2, вам не составит труда привести другие примеры, в которых средняя величина не реализуется в действительности. Кто сумеет бросить игральную кость так, чтобы на ней выпало среднее число очков за длинную серию бросаний?
А вот еще несколько вопросов, которые помогут вам глубже понять различие между средним арифметическим, медианой и модой.
1. Предположим, что редактору пришло в голову поместить фотографию семьи, «типичной» в смысле моды. Всегда ли фотограф сумеет найти такую семью?
(Да, типичная семья в смысле моды существует.)
2. Могут ли существовать сразу несколько мод?
Например, могут ли быть одновременно образчиками моды семьи с двумя и с тремя детьми? (Да, если в городе проживает 1476 семей с двумя детьми, 1476 семей с тремя детьми, а число семей с одним ребенком или с четырьмя и более детьми меньше 1476, то в городе наиболее распространены семьи двух первых типов. Каждая из семей с двумя и с тремя детьми с полным основанием может быть названа модой.)
3. Удастся ли фоторепортеру выполнить задание, если редактору понадобится снимок семьи-медианы?
(В большинстве случаев удастся, но не всегда. Как мы уже упоминали, даже если в городе проживает четное число семей, но в двух средних семьях (в списке семей, расположенных в порядке возрастания или убывания числа детей) число детей будет различным; медиана не обязательно должна быть целым числом.)
Поспешные выводы
Как показывает статистика, преобладающее большинство дорожно-транспортных происшествий приходится на долю машин, едущих с умеренной скоростью, и лишь незначительное число — на долю машин, мчащихся со скоростью свыше 150 км/ч. Означает ли это, что водить машину на больших скоростях безопаснее?
Нет, не означает. Статистические соотношения часто не имеют ничего общего с причинно-следственными связями. Большинство людей водят машины с умеренной скоростью, поэтому и большинство происшествий приходится на их долю.
Как показывает статистика, смертность от туберкулеза в штате Аризона выше, чем в других штатах. Означает ли это, что климат Аризоны благоприятствует развитию туберкулезной палочки?