Сигма хороша тем, что она может трансформироваться в вероятность того, какой реальный результат будет получен (даже несмотря на то, что точная формула очень сложна и, как правило, вы просто ищете число в справочнике). Если мы бросаем монетку 100 раз и от 45 до 55 раз выпадает орел, мы говорим, что результат находится «в интервале одной сигмы», что происходит в 68 % испытаний.
Другими словами, результаты, отличающиеся более чем на одну сигму, мы получаем примерно в 32 % испытаний, что немало, так что в результате, отличающемся на одну сигму, нет ничего, что могло бы насторожить. Вы бы не стали подозревать, что монетка «неправильная», только потому, что в 100 подкидываниях 55 раз выпал орел и 45 решка.
Большие сигмы соответствуют все менее вероятным результатам (при условии, что верна нулевая гипотеза). Если у вас из 100 раз орел выпал 60, это отклонение в две ст, и такое происходит только примерно в 5 % испытаний. Этот результат кажется маловероятным, но не совсем неправдоподобным. Его недостаточно, чтобы отвергнуть нулевую гипотезу, но достаточно, чтобы возбудить некоторые подозрения. Выпадению 65 раз орла соответствовало бы отклонению в три ст, что соответствует вероятности 0,3 %. Эти события случаются довольно редко, и теперь у нас появились законные основания думать, что происходит нечто странное. Если бы у нас выпал орел 75 раз из 100, это бы было отклонением в пять ст, а такие события случаются реже чем один раз на миллион. И тогда мы вправе сделать вывод, что сигнал был не просто статистической флуктуацией, и нулевая гипотеза неверна – монетка попалась явно неправильная.
Сигнал и фон
Поскольку физика элементарных частиц управляется квантовой механикой, она очень похожа на подкидывание монетки: самое большее, что мы можем сделать, это предсказывать вероятности. На БАКе мы сталкиваем протоны друг с другом и предсказываем вероятность различных взаимодействий. Для частного случая поиска бозона Хиггса мы рассматриваем различные «каналы», каждый из которых определяется типом частиц, захваченных детекторами. Есть двухфотонный канал, двухлептонный канал, четырехлептонный канал, канал с двумя струями и двумя лептонами, и так далее. В каждом случае мы суммируем энергии вылетающих частиц и с помощью аппарата квантовой теории поля (дополненного реальными измерениями) рассчитываем, сколько событий могли бы ожидать для каждого значения полной энергии. Результаты, как правило, изображаются в виде гладкой кривой.
Наша нулевая гипотеза состоит в том, что бозона Хиггса нет. Если же бозон Хиггса существует, да к тому же обладает какой-то ненулевой массой, основной ожидаемый эффект от него состоит в том, что для соответствующей энергии число событий увеличится. Если масса бозона равна 125 ГэВ, создается некоторое дополнительное количество частиц с суммарной энергией 125 ГэВ, и так далее. Создание бозона Хиггса и его распад обеспечивает механизм (в дополнение ко всем процессам, не связанным с бозоном Хиггса) получения частиц, суммарная энергия которых, как правило, равна массе хиггсовского бозона, что приводит к некоторому количеству дополнительных (по отношению к фону) событий. И мы отправляемся на «сбор шишек» – то есть ищем заметные отклонения от гладкой кривой, которую бы увидели при отсутствии бозона Хиггса.
Мы и не предполагали, что расчет ожидаемого фона будет легкой задачей. Мы, конечно, знаем Стандартную модель, но то, что мы ее знаем, не означает, что рассчитать результат легко. (Стандартной моделью можно описать и атмосферу Земли, но предсказать погоду не так-то просто). С помощью самых совершенных компьютерных алгоритмов ученые моделируют наиболее вероятные исходы протонных столкновений, и эти результаты используются для моделирования работы самих детекторов. И, оценив их усилия, мы охотно признаем, что некоторые вероятности реакций частиц легче измерить, чем просчитать. Чтобы минимизировать влияние человеческого фактора и для лучшего подбора параметров модели часто используется «слепой» анализ, когда каким-то способом скрываются фактические данные в интересующей нас области: либо туда добавляются фиктивные данные, либо просто события в этом «окне» не рассматриваются. Потом добиваются максимально ясного понимания «неинтересных» данных в других областях, и только после того, как это понимание будет достигнуто, открывается «окно», и мы смотрим на экспериментальные данные в той области, где наша частица может скрываться. Подобные манипуляции гарантируют, что мы видим не то, что хотим увидеть, а то, что происходит в действительности.
Так было не всегда. В своей книге «Нобелевские мечты» (Nobel’s Dreams) журналист Гэри Таубес рассказывает об истории исследований Карло Руббиа начала 1980-х годов по обнаружению W– и Z-бозонов, которые принесли ему Нобелевскую премию, а также о его менее успешных попытках получить вторую Нобелевскую премию, за его дерзкие выходы за пределы Стандартной модели. Команда Руббиа использовала при анализе данных по столкновению частиц Megatek – компьютерную систему, которая могла отображать данные на экране компьютера, причем программа позволяла поворачивать изображение вокруг трех координат с помощью джойстика. Заместители Руббиа американец Джеймс Рольф и англичанин Стив Гир стали экспертами в работе на Megatek. Они могли посмотреть на событие, повернуть его немного, отобрать важные треки частиц и уверенно сказать, что они видят – W-, Z-бозон или тау-частицу. «У вас есть эти вычисления, – говорил Руббиа, – но конечная цель всей титанической работы по анализу данных, основная фундаментальная задача должна состоять в том, чтобы дать людям окончательный ответ. И только Джеймс Рольф, глядя на это чертово событие, решит – Z-бозон это или нет». Теперь ситуация изменилась. У нас сейчас гораздо больше данных, но единственный способ понять, что они означают, – пропустить их через компьютер.
Всякий раз, когда возникают некоторая надежда на то, что получен новый экспериментальный результат, первой реакцией становится вопрос: «Сколько сигм?». В физике элементарных частиц неформальный стандарт вырабатывался на протяжении многих лет, и в соответствии с ним отклонение 3σ считается «свидетельством» того, что что-то происходит, в то время как при отклонении в 5σ уже можно объявлять об «открытии» чего-то. Это может показаться излишним требованием, так как фоновое событие 3σ происходит обычно только с вероятностью 0,3 %. Но правильнее было бы рассуждать об этом так: если посмотреть на триста различных измерений, одно из них просто случайно может оказаться событием 3σ! Так что требование придерживаться критерия 5σ является справедливым.
К декабрьскому семинару 2011 года пик вблизи 125 ГэВ имел статистическую значимость[7] 3,6σ в данных ATLAS и 2,6σ в данных CMS (данные собирались и анализировались совершенно независимо). Многообещающие результаты, но, конечно, не настолько надежные, чтобы претендовать на открытие. Результат мог быть признан сомнительным из-за так называемого эффекта LEE (look-elsewhere effect). Как мы говорили, если делать много измерений (а на двух детекторах БАКа проводилось много измерений), в них могут случиться большие отклонения. Однако тот факт, что две коллаборации обнаружили пики в одном и том же месте, наводил на мысль, что это не было простой случайностью. Физики склонялись к тому, что экспериментальные данные говорят: поиски идут в правильном направлении и, видимо, обнаружены первые намеки на бозон Хиггса, но чтобы увериться в этом, нужно собрать еще больше данных.
Когда предсказания, которые вы проверяете, являются вероятностными, важность сбора большого количества данных невозможно переоценить. Вспомните наш пример с подкидыванием монетки. Если бы мы бросили монетку всего пять раз вместо 100, самое большое возможное отклонение от ожидаемого значения возникло бы при пятикратном выпадании орла (или решки). Шанс, что это произойдет, не маленький – больше 6 %. Таким образом, даже для совершенно неправильной монеты, если мы подбрасываем ее всего пять раз, мы не можем объявить о значимости отклонения больше 2σ. На групповом блоге Cosmic Variance, который благодаря моим усилиям размещается теперь на сайте журнала Discover, я за день до семинаров ЦЕРНа поместил свой пост под названием «Завтра об открытии бозона Хиггса не объявят». Не то, что у меня была какая-то инсайдерская информация, просто мы все знали, сколько к тому времени на БАКе собрано данных, и знали, что их недостаточно для объявления об открытии бозона Хиггса с точностью 5σ. Для этого требовалось гораздо больше данных.