3. Тем не менее знакомство с распределениями реакций и с усредненными показателями людей может сослужить нам хорошую службу в достижении определенного рода прогностической цели. Даже основываясь на столь низком значении корреляции отдельных реакций, как 0,16, мы будем в состоянии сделать некоторые предсказания об относительной вероятности проявления различными конкретными индивидами определенного рода экстремальных реакций. В самом деле, зная, что данный человек продемонстрировал экстремально «сильную» реакцию даже по одному единственному поводу, можно спокойно заключить, что его реакция по какому-либо другому поводу с гораздо большей вероятностью будет экстремально сильной, чем экстремально слабой. А знание о том, что усредненная реакция индивида в ходе множества наблюдений оказалась экстремальной, позволяет различиям относительной вероятности появления в будущем особо низких и особо высоких показателей достигать поистине впечатляющего уровня.
Предсказания, основанные на единичных наблюдениях
Приступим к более детальному рассмотрению нашего гипотетического исследования согласованности поведения, обратившись к типичному корреляционному полю (см. рис. 4.1,0), иллюстрирующему корреляцию между реакциями в двух различных ситуациях, относящихся к одной и той же черте личности, такой, как, например, экстраверсия. Эта корреляция равняется в нашем случае 0,16.
Рис. 4.1. Корреляционные поля, показывающие корреляцию, равную 0,16 (а), и корреляцию, равную 0,00 (б).
Данное корреляционное поле может изображать, например, взаимосвязь между показателями общительности учеников шестого класса некоей начальной школы, зафиксированными в один из дней во время обеда, и показателями общительности, зафиксированными несколькими днями позже на игровой площадке. Мы видим большую вариативность уровней экстравертированности, проявленной различными детьми в каждой из ситуаций, и слабую взаимосвязь между реакциями этих детей в первой и во второй ситуациях, с трудом отличимую, по крайней мере, при беглом просмотре от полного ее отсутствия (см. рис. 4.1,6).
Столь незначительная взаимосвязь, очевидно, означает, что знание о реакции, проявленной индивидом в одной из ситуаций, мало чем может нам помочь в предсказании реакции в другой подобной ситуации. Чтобы быть более точными, основываясь на традиционной формуле регрессии, можно сказать, что наилучшее при данных обстоятельствах предсказание сократило бы нашу среднюю, или «стандартную» ошибку прогнозирования на очень незначительную величину (всего около 1%).
Причина лежит на поверхности. Когда предсказываемые результаты, как в случае с показателями экстраверсии наших шестиклассников, чрезвычайно вариабельны, наилучший прогноз, который мы могли бы дать, основываясь на нашем знании об одной из предыдущих реакций, будет фактически во всех случаях соответствовать среднему для наших шестиклассников уровню экстравертированности. Иными словами, сделанные нами предсказания будут в целом похожи на те, что мы сделали бы, не зная ничего об экстравертированных проявлениях того или иного индивида в прошлом.
Рис. 4.2. Наиболее удачные предсказания последующей реакции (верхний график распределения), основанные на знании предшествующей реакции (нижний график распределения) для индивидов, показатели которых равны пяти различным процентным рангам (C).
Графически эта мысль отображена на рис. 4.2. Нижнее из двух распределений отражает наблюдения за поведением в отдельно взятом случае, к примеру уровень агрессивности, которую проявили 100 шестиклассников на детской площадке во вторник. Распределение представляет собой знакомую кривую в форме колокола, на которой частота вероятности отдельной реакции уменьшается, по мере того как рассматриваемая реакция становится все более экстремальной.
Выберем для рассмотрения пятерых детей: ребенка, проявляющего уровень агрессивности на два стандартных отклонения ниже средней величины (процентный ранг «2» означает, что меньшую агрессивность проявил только один ребенок из совокупности); ребенка, уровень агрессивности которого ниже средней на величину одного стандартного отклонения (процентный ранг «15» означает, что данный ребенок попадает приблизительно в нижнюю шестую или седьмую части распределения уровней агрессивности); ребенка, проявившего средний уровень агрессивности (процентный ранг «50»), и двух детей с уровнем агрессивности выше среднего на величину соответственно одного (процентный ранг «85») и двух (процентный ранг «98») стандартных отклонений{15}. Верхний график распределения иллюстрирует наше самое удачное предсказание степени агрессивности, которую в соответствии с нашими ожиданиями те же самые шестиклассники, включая пятерых отобранных для особого рассмотрения, должны были проявить во время экскурсии в музее естественной истории.
Легко увидеть, что наиболее точный прогноз, который мы могли бы дать по каждому из детей, соответствует уровню агрессивности, близкому к среднему. Их действительные реакции будут, конечно же, весьма вариативны, но, принимая во внимание то, что коэффициент корреляции равняется всего 0,16, мы не сможем предсказать, кто из этих детей проявит экстремальную реакцию, а кто нет. Так что даже в случае с одним из двух детей, проявивших наибольшую агрессивность на детской площадке (предположим, это был Билли, который повалил Эллен и Джеймса наземь и крикнул: «Отвали!» — застенчивому Чарли), лучший прогноз будет заключаться в том, что Билли будет лишь немного агрессивнее «среднего» ребенка, возможно, он будет чуть более активно толкаться локтями, стоя в строю и достаточно громко ворчать по поводу скучной экспозиции, привлекая внимание кого-либо из учителей. И действительно, находясь в музее, он с гораздо меньшей вероятностью совершит что-либо в самом деле агрессивное (например, затеет драку), чем будет вести себя более спокойно по сравнению со средним одноклассником. Наоборот, и это не менее существенно, Джейн, которая сорвала с вешалки пальто другой девочки, чтобы повесить на нее свое, а затем понеслась по музею, производя достаточно много шума, чтобы быть призванной к порядку одним из учителей (попав, таким образом, в число двух детей, проявивших наибольшую агрессивность во время экскурсии), вряд ли оказалась бы среди детей, которые вели себя наиболее агрессивно на детской площадке. Уровень агрессивности, который она проявила в последнем случае, скорее всего, был бы немногим выше среднего.
Предсказания, основанные на множественных наблюдениях
Итак, в чем же состоят преимущества агрегирования? Предположим, что мы классифицировали детей на основании не одного, а 50, 100 или даже бесконечно большого числа наблюдений. Можно с уверенностью сказать, что мы были бы в состоянии очень точно предсказать средний уровень застенчивости, агрессивности и подобных им личностных характеристик, которые каждый ребенок обнаруживал бы в ходе множества дальнейших наблюдений. В самом деле, нам удалось бы точно спрогнозировать распределение реакций каждого ребенка в целом, т.е. мы смогли бы с уверенностью предсказать, что распределение реакций каждого ребенка в будущем будет близко напоминать распределение его же реакций в прошлом. Однако при этом нам не удалось бы существенно снизить нашу неопределенность в отношении поведения конкретного ребенка в конкретной единичной ситуации.
В частности, если бы нам был известен усредненный, или «истинный», показатель агрессивности того или иного ребенка, вычисленный на основании данных, полученных за продолжительный период, исходя из которого мы бы строили свои прогнозы в отношении данного индивида, то это позволило бы нам сократить среднюю разницу между нашими предсказаниями и данными реальных последующих наблюдений приблизительно лишь на 8%, т.е. наша средняя ошибка будет в этом случае на 8% меньше, чем если бы мы просто предположили, что поведение каждого ребенка в каждой ситуации будет соответствовать среднему показателю для всего класса.