Валидность характеризует степень, в которой тест измеряет то, для измерения чего он предназначен. В качестве маловероятного примера мы могли бы использовать цвет глаз как меру привлекательности человека для представителя противоположного пола. Наш тест будет очень надежным: у обученных наблюдателей не будет различий в оценках тех, у кого голубые, зеленые или карие глаза, и цвет глаз участника теста вряд ли изменится, если мы оценим его снова месяц или два спустя. Однако цвет глаз, скорее всего, не будет валидным показателем привлекательности, он, вероятно, не будет связан с числом свиданий, которые были у человека в прошлом году. Однако, если бы наблюдатели оценивали привлекательность лица в целом или видеозапись диалога человека с представителем противоположного пола, их оценки могли бы оказаться чуть менее надежными, но более валидными показателями желательности будущих свиданий.
Психологический тест – инструмент для оценки способностей, умений/знаний или мотиваций индивида.
Надежность – согласованность, непротиворечивость результатов психологического теста.
Валидность – степень, в которой тест измеряет то, для измерения чего он предназначен.
Надежность и валидность могут представлять проблему для всех методов. Например, архивные записи о различиях возрастов мужчин и женщин при вступлении в брак достаточно хорошо согласуются между собой в разных культурах и в разные периоды времени (Campos et al., 2002; Kenrick & Keefe, 1992). Поэтому они могут давать надежную оценку (например, того, что в юношеском возрасте в брак вступает одинаковое число мужчин и женщин). Однако такие записи, сделанные в маленьком городке в течение одного месяца, вероятно, будут служить ненадежным источником данных (допустим, в этот месяц в брак вступили два несовершеннолетних мужчины и одна несовершеннолетняя женщина).
Что касается валидности, то три разных экологических опроса могут согласованно показывать, что теперь люди уделяют больше внимания утилизации бытового мусора и меньше ездят на машинах. Однако, хотя ответы на эти вопросы являются надежными, они могут оказаться невалидными. Люди могут неправильно представлять свои привычки утилизировать мусор и водить машину. Таким образом, при каждом поисковом исследовании важно задавать вопросы: надежны ли полученные результаты (то есть получим ли мы те же самые результаты, если измерения будут сделаны другим способом или другим наблюдателем), валидны ли эти результаты (то есть действительно ли исследователь изучает то, что он собирается изучать)?
Корреляция и причинная обусловленность
Данные, полученные с помощью описательных методов, могут обнаруживать корреляцию, то есть то, как часто две или более переменных появляются вместе (психологи используют термин «переменная» применительно к любому изменяющемуся показателю, будь то дневная температура, человеческий рост, цвет волос, численность толпы или количество алкоголя, потребляемого в кампусах разных колледжей). Леон Манн (Mann, 1981) решил выяснить, какие переменные могут быть связаны с таким неоднозначным явлением, как подстрекательство к самоубийству, когда зрители побуждают самоубийцу сделать последний шаг навстречу смерти. В одном случае ночная толпа из 500 зевак не только призывала Глорию Полицци спрыгнуть с пятидесятиметровой водонапорной башни, но также выкрикивала ругательства в адрес команды спасателей и бросала в нее камни. Воспользовавшись газетными архивами для изучения этой темы, Манн установил, что активность подстрекательства к суициду коррелирует с численностью толпы. Чем многочисленнее толпа, тем активнее она может издеваться над человеком, стоящим на границе между жизнью и смертью.
Исследование
Представьте, что вы как журналист получили задание написать статью о том, чем какая-то интересная группа людей (например, многоженцы из штата Юта, члены нью-йоркской банды гангстеров или голливудские кинозвезды) отличается от типичного американского жителя пригородных районов. Какие описательные методы вы могли бы использовать, чтобы изучить эту тему, и какие проблемы могли бы помешать вам сделать обоснованные заключения?
Корреляция между двумя переменными часто выражается математически с помощью статистического показателя, называемого коэффициентом корреляции. Коэффициент корреляции может изменяться от +1,0, что соответствует полной прямой связи между двумя переменными, через 0, что указывает на полное отсутствие связи, до −1,0, что соответствует полной обратной связи. Положительная корреляция означает, что, когда одна переменная растет или уменьшается, другая переменная растет или уменьшается вместе с ней. Например, когда численность толпы растет, количество призывов к самоубийству также увеличивается. Отрицательная корреляция указывает на наличие обратной зависимости: когда одна переменная растет или уменьшается, другая изменяется в противоположном направлении. Например, женщины, которые больше преданы своим нынешним партнерам и больше довольны ими, обращают меньше внимания на других мужчин (Maner et al., 2003; Miller, 1997).
Показатели корреляции могут содержать полезные подсказки, но они не дают исследователю возможности сделать выводы о причинах и следствиях. Рассмотрим зависимость между численностью толпы и подстрекательством к самоубийству. Многочисленная толпа ассоциируется с разными формами неприемлемого в иных случаях поведения, которые часто можно наблюдать на рок-концертах, вечеринках по случаю празднования Хэллоуина или в массовых шествиях болельщиков по окончании важных спортивных состязаний. Казалось бы, можно прийти к выводу, как это сделал Манн в своем исследовании, что человек, находящийся в многочисленной толпе, чувствует свою анонимность. Это, в свою очередь, может снизить его озабоченность возможностью его идентификации как соучастника такого жестокого и отвратительного деяния. Однако важно помнить, что корреляция не равнозначна причинно-следственной связи.
Корреляция – степень связи двух или более переменных между собой.
Коэффициент корреляции – математическое выражение зависимости между двумя переменными.
Но почему корреляция не равнозначна причинно-следственной связи? Во-первых, всегда сохраняется возможность того, что предполагаемое направление причинности изменится на противоположное, то есть В будет вызывать А, а не А вызывать В (рис. 1.2). Например, как только начинается побуждение к самоубийству, об этом могут сообщить по радио, что может заставить жителей близлежащих улиц пойти посмотреть на необыкновенное зрелище (таким образом, побуждение к самоубийству приведет к росту численности толпы, а не наоборот). Другая проблема состоит в том, что корреляции могут быть найдены тогда, когда причинная связь отсутствует вовсе, в частности когда третья переменная С вызывает появление и А, и В. Например, Манн также обнаружил, что побуждение к самоубийству чаще происходит по вечерам. Возможно, потому, что люди обычно потребляют алкоголь вечером, а захмелевшие люди чаще проявляют стадное чувство (то есть охотнее присоединяются к толпе) и становятся неуправляемыми (и, следовательно, начинают насмехаться над потенциальным самоубийцей). Если это так, то ни вечернее время, ни численность толпы не являются прямой причиной побуждения к самоубийству; каждая из этих переменных оказывается случайно связанной с количеством самоубийств.
Рис. 1.2. Объяснение корреляций. Когда две переменные (такие как численность толпы и подстрекательство к самоубийству) коррелируют между собой, то возможно, что переменная А (в данном примере численность толпы) вызывает изменение переменной В (подстрекательство к самоубийству). Однако также возможно, что переменная В влияет на переменную А или что третья переменная С (в данном примере – потребление алкоголя в вечернее время) влияет на А и В независимым образом.