4
Недавно я решил, что мне нужен — и немедленно! — точный текст монолога Билла Мюррея из пьесы "Хижина для Кадиллака" о носильщике сумки для гольфа Далай Ламы. Ключевые слова там следующие: "Мне это выпало, ну и хорошо", а Далай Лама, в пересказе Мюррея, с удовольствием повторял: Гунга галунга". Итак, я обратился к Google, крупнейшей поисковой системе Интернета, набрал "мне это выпало" и "гунга", потом нажал на кнопку "Поиск". Спустя секунду на моем экране появился список из 695 веб-страниц. Первой в списке оказалась статья из Golf Online, в которой присутствовала вторая часть монолога. Нормально, но третьим в списке был сайт некой организации под названием Репп State Soccer Club[7]. Вратарь по имени Дэвид Файст поместил в Интернете полный текст монолога. Поиск занял 0,18 секунды.
В другой раз мне понадобилось просмотреть работу Мулхерина о катастрофе "Челленджера", которую я упомянул ранее. Я не мог вспомнить имя автора и набрал "реакция фондового рынка на катастрофу Челленджера". Мне было предложено 2370 веб-страниц. На первой была статья в Slate Дэниэла Гросса о работе Мулхерина. Третьей была собственная страница Мулхерина со ссылкой на запрашиваемый мною отчет. Поиск (в котором, если помните, не присутствовало имя автора) занял 0,10 секунды. Несколько минут спустя я поискал текст песни Рамона о том, как Рональд Рейган посетил кладбище в Битбурге, и это заняло 0,23 секунды, и первая ссылка в списке оказалась именно той, которую я искал.
Если вы регулярно пользуетесь Интернетом, эти примеры эффективности Google вас не удивят. Мы привыкли ожидать от поисковой системы мгновенного ответа с нужной нам страницей в начале списка. Но все же давайте копнем немного глубже и попробуем разобраться в том, что же происходит в эти десятые доли секунды. Каждый раз Google пролистывает миллиарды веб-страниц и выбирает именно те, которые точнее соответствуют запросу пользователя. Суммарное время всех упомянутых мною поисков заняло примерно полторы минуты.
Google была создана в 1998 году, когда лидером бизнеса поисковых систем была Yahoo!, a AltaVista и Lycos наступали ей на пятки. Но уже спустя два года самой популярной поисковой системой среди постоянных пользователей Интернате стала Google — только потому, что она действует быстрее и предоставляет самые точные результаты поиска. Способ же, которым она этого добивается (пролистывая при каждом запросе три миллиарда веб-страниц), построен на мудрости толпы.
Создатели Google не раскрывают все детали своей технологии, но известно, что сердцевиной системы является алгоритм PageRank, который был описан основателями компании Сергеем Брином и Лоренсом Пейджем в теперь уже легендарной работе 1998 года The Anatomy of a Large-Scale Hypertextual Web Search Engine. PageRank — это алгоритм (метод калькуляции), согласно которому все страницы в Интернете сами решают, какие из них лучше соответствуют критериям заданного поиска. Вот как объясняет это сама Google: PageRank пользуется преимуществами уникальных демократических особенностей Сети, применяя в качестве инструмента организации поиска широчайшую структуру ссылок. По сути, Google интерпретирует ссылку страницы А на страницу Б как голос, отданный страницей А в пользу страницы Б. Google оценивает соответствие страницы критериям заданного пользователем поиска по числу полученных ею голосов. Однако Google учитывает не просто число голосов или ссылок; система анализирует также страницу, отдавшую голос. Голоса, отданные страницами, которые заслуживают доверия, оцениваются выше и помогают определить другие страницы как достаточно надежные.
В эти десятые доли секунды Google сканирует всю Всемирную сеть, чтобы решить, какая из ее страниц содержит наиболее полезную информацию, и страница, получившая большинство голосов, помещается на первое место в итоговом списке. И эта страница или стоящая в списке сразу за ней чаще всего оказывается именно той, в которой содержится самая ценная информация.
В настоящее время система Google — это республика, но не идеальная демократия. Как гласит описание, чем больше людей обращаются к странице, тем больше повлияет эта страница на окончательное решение. Заключительное голосование — это "взвешенное среднее" (так же, как курс акции или разброс результатов игр НФЛ), отличающееся от простого среднего, как в случае с оценкой веса каких-то предметов. Тем не менее крупные порталы, имеющие большее влияние на окончательный вердикт толпы, получают его лишь благодаря голосам, которые отдали им мелкие сайты. В противном случае релевантность поиска Google не оказалась бы столь высокой. Итак, и здесь правит толпа. Мудрость на вершине системы обеспечивается разумностью по всей ее вертикали.
5
Если возможность делать ставки на результаты спортивных игр в конечном итоге ведет к созданию механизма, успешно предсказывающего итоги состязаний, возникает закономерный вопрос: будут ли ставки на другие события так же успешны, если исход предскажет группа? Зачем ограничивать себя информацией о шансах команды Лос-Анджелеса против команды Сакраменто, если есть способ узнать, какова вероятность, скажем, у Джорджа Буша обойти на президентских выборах Джона Керри?
Способ определить шансы Джорджа Буша на победу существует — это опросы общественного мнения. Если хотите узнать, как собираются голосовать люди, спросите у них. Опросы общественного мнения дают относительно точные результаты. В их основе лежит солидная методология, и они статистически скрупулезны. Но есть причина задуматься о том, не может ли рынок спортивных тотализаторов (который позволяет его участникам опираться на многие виды информации, включая опросы, но не ограничиваясь ими) предложить альтернативную конкуренцию институту Гэллапа. Именно поэтому появился Iowa Electronic Markets (IEM) ("Электронный рынок штата Айова").
IEM, основанный в 1988 году и управляемый бизнес-колледжем при Университете Айовы, представляет собой семейство рынков, прогнозирующих результаты выборов — президентских, в Конгресс, на пост губернатора и за рубежом. Открытый для всех потенциальных участников, IEM позволяет людям продавать и покупать фьючерсные контракты на основе их мнения о том, как выступит тот или иной кандидат на предстоящих выборах. Из всего многообразия предлагаемых IEM типов контрактов наиболее распространены два. Один основывается на прогнозах о победителе выборов. Например, в случае повторного голосования в Калифорнии в 2003 году вы могли бы приобрести контракт "победит Арнольд Шварценеггер", который, в случае победы Шварценеггера, принес бы вам один доллар. В противном случае вы бы ничего не получили. Цена, которую вы платите за подобный контракт, отражает мнение рынка о шансах кандидата на победу. Если контракт кандидата стоит 50 центов, значит, что его шансы на победу, по мнению рынка, составляют 50%. Если контракт стоит 80 центов, его шансы на победу 80% и так далее.
Другой основной вид контракта IEM прогнозирует, сколько процентов голосов избирателей получит кандидат в результате прямых выборов. В этом случае выплаты определяются процентом голосов: если вы купили контракт Джорджа Буша 2000 года, после завершения выборов вы получили бы 48 центов (он получил 48% голосов).
Прогнозы IEM точны, ибо цены на эти контракты близки к их реальным значениям. Рынок предсказывает исход выборов на основе того, что фаворит всегда выиграет, а более сильные фавориты должны выиграть с большим отрывом. Точно так же на электоральном рынке — если бы Джордж Буш получил в итоге 49% голосов в 2004 году, тогда цена контракта Джорджа Буша на предварительных выборах приблизилась бы к 49 центам.
И как справился с задачей IEM? Что ж, исследование эффективности IEM в ходе сорока девяти различных избирательных кампаний в период между 1988 и 2000 годами установило, что прогнозы IEM накануне выборов отклонялись, в среднем, всего на 1,37% в случае президентских выборов, на 3,43% — в случае других выборов в США и на 2,12% — в случае выборов за рубежом. (Цифры в абсолютном выражении, и это означает: рынок ошибся бы, скажем, на 1,37%, если бы предсказал, что Эл Гор получил бы 48,63%, при том, что в реальности он получил 50%). В целом, IEM превзошел популярные национальные опросы общественного мнения, и был точнее их уже за несколько месяцев до выборов. Например, в ходе подготовки к президентским выборам в период между 1988 и 2000 годами было обнародовано 596 результатов различных опросов общественного мнения. В трех четвертях случаев цены на рынке IEM в дни, когда публиковались эти опросы, оказывались все более точными. Результаты таких опросов очень непостоянны, соотношение голосов сильно колеблется. Однако прогнозы IEM, несмотря на их изменчивость, значительно менее гибки, они имеют тенденцию к изменению только в ответ на новую информацию. Это делает их более надежным средством прогнозирования.