«Когда вы видите что-то необычное, у вас нет другого выхода, кроме как исследовать это. Я подумал, что над этим хорошо было бы продолжить работу», – говорит он, пока мы продолжаем прогулку по солончакам. Он догадывался, что загадочные повторы могут быть как-то связаны с адаптацией к концентрации соли, возможно за счет изменения их конфигурации, а следовательно, активности генов, при регистрации колебаний осмотического давления клетки. «В то время суперспирализация [ДНК] была ответом на все вопросы, связанные с регуляцией экспрессии генов!» Это была хорошая гипотеза, но неверная[92].
Работая в университетской библиотеке в неурочное время, Мохика в конце концов обнаружил статью японских ученых за 1987 г. В ней Ацуо Наката и Йосизуми Исино[93] из Университета Осаки описали аналогичный повторяющийся мотив в геноме E. coli. Секвенируя исследуемый ген, японская группа заметила необычную соседнюю последовательность с характерными повторами, похожими на круги на полях, вырезанные на поверхности ДНК. Этот участок состоял из серии (кластера) коротких повторов палиндромной последовательности (читающихся одинаково в прямом и обратном направлении). Повторы, состоящие из двадцати девяти букв, были отделены друг от друга отрезком уникальной последовательности из тридцати двух оснований (спейсерами). Однако, поскольку никто до этого не видел ничего подобного и ничто не говорило об их биологической функции, исследователи не придали этому значения. Команда, как положено, описала и опубликовала свои наблюдения, которые в то время не привлекли к себе внимания[94].
Два года спустя[95] Мохика описал короткую последовательность, повторяющуюся сотни раз в тандемном повторе, охватывающем более 1000 оснований. Между каждой парой таких повторов была уникальная последовательность ДНК с неизвестной функцией. Руководитель Мохики предложил назвать эти повторы, которые также наблюдались у другого экстремофила – архей, любящих вулканы, TREP (от англ. tandem repeats – «тандемные повторы»). Несомненно, должна быть причина, по которой до 2 % драгоценной, компактной ДНК прокариот выделено под эти странные повторы. «Микроорганизмы не могут позволить себе такую роскошь, – думал Мохика. – Они должны выполнять важную функцию»[96].
Другие ученые тоже сталкивались с такими повторами. Немецкий микробиолог Бернд Мазеполь ломал голову над фрагментом ДНК с тринадцатью повторами, найденным в цианобактериях, который он назвал LTRR, что означает «длинное тандемно повторяющееся повторение» (от англ. long tandemly repeated repetitive). Однако, сосредоточившись на этих участках ДНК, Мазеполь не обратил внимания на уникальные последовательности, расположенные между ними[97]. Другая команда также была близка к разгадке тайны повторов ДНК. В 2002 г. Евгений Кунин, российский специалист по вычислительной биологии из Национального центра биотехнологической информации при Национальном институте здравоохранения США, и его коллега Кира Макарова описали серию бактериальных генов, которые, как они подозревали, входят в систему репарации ДНК[98]. Вот только они не поняли, что эти гены располагались рядом с участком CRISPR и, как мы вскоре увидим, играли важную роль в работе CRISPR и в редактировании генов.
После нескольких лет работы в Оксфордском университете Мохика вернулся в Аликанте в 1997 г., чтобы собрать собственную научную группу. Получив небольшое финансирование, Мохика попытался провести несколько недорогих экспериментов, «хотя и понятия не имел о биоинформатике». Вопрос, который не давал покоя, касался происхождения спейсерной ДНК – последовательностей, вкрапленных между повторами. «Искать по базам данных и ждать, когда хоть что-нибудь найдется, несложно, но мы ничего не получали – до 2003 г.». К тому времени базы данных последовательностей ДНК были переполнены геномами бактерий и архей, многие из которых содержали версии этих повторов.
В 2000 г. Мохика переименовал объект своей одержимости в SRSR (от англ. short regularly spaced repeats – «короткие регулярно расположенные повторы»). Это название просуществовало недолго. Позже он обменялся электронными письмами с Руудом Янсеном из Нидерландов, который изучал семейство генов, примыкающих к загадочным повторам. Янсен чувствовал необходимость обозначить открытие как-то иначе, поэтому Мохика предложил CRISPR. 21 ноября 2001 г. Янсен ответил ему, восторженно выразив свое одобрение:
Дорогой Франсис,
Какая замечательная аббревиатура – CRISPR! Я считаю, что каждая буква, которой не хватало в других версиях, делала их менее «хрустящими», поэтому я предпочитаю более энергичный CRISPR, а не SRSR и SPIDR[99].
У CRISPR наконец-то появилось название, как и у группы необычных генов, которые, казалось, были связаны с элементами CRISPR. Янсен разумно, хотя и без всякого воображения, назвал их Cas (от англ. CRISPR-associated – «связанные с CRISPR»). В то время Мохика был все еще сосредоточен на изучении любопытных спейсеров CRISPR.
В конце концов прорыв был совершен красивым вечером в августе 2003 г. Мохика проводил со своей женой отпуск недалеко от дома, около соляных озер. Из-за жары Мохика нашел повод вернуться в лабораторию, оборудованную кондиционером, где он мог провести еще несколько компьютерных поисков. Это было обычным делом, почти как в видеоигре: Мохика копировал последовательность одного из загадочных спейсеров и вводил ее в компьютерную программу BLAST, которая искала совпадения в огромной базе данных ДНК – GenBank. Мохика запускал этот поиск сотни раз, но безрезультатно. Коллеги говорили, что это пустая трата времени. Но в тот день, к его удивлению, компьютер зафиксировал совпадение. Один конкретный спейсер из E. coli соответствовал участку вирусной ДНК под названием P1, который, что важно, инфицирует эту же бактерию. В течение последующих недель Мохика каталогизировал десятки других совпадений между спейсерами CRISPR и различными вирусами.
В октябре Мохика отправил самую важную статью в своей жизни в ведущий журнал – Nature. «Я помню, что заголовок звучал так: "Повторы прокариот участвуют в работе иммунной системы". Чтобы убедить редактора и рецензентов, мы написали, что открытие приобретенной иммунной системы прокариот будет иметь огромное значение для биологии и клинических наук. И каков был результат? Нашу работу даже не рассмотрели!»[100]
Возможно, что-то неверно перевели, но редакторы журнала Nature не нашли эту идею концептуальным достижением, «представляющим достаточный общий интерес», которого заслуживают публикации на его престижных страницах. Мохика подал апелляцию, утверждая, что это первое описание бактериальной иммунной системы с функцией памяти. Сотрудники Nature указали, что они готовы пересмотреть свое решение, если им будет предоставлено описание механизма, лежащего в основе этого свойства иммунитета. Однако группа Мохики не смогла найти экспериментального подтверждения гипотезе. Все, что у них было, – это бесспорное доказательство в виде последовательностей. Одна из причин, как оказалось, заключается в том, что CRISPR не работала в наиболее популярном лабораторном материале, E. coli[101]. Как если бы у Мохики были уличающие вещественные доказательства, но не было видеозаписи с камер наблюдения.
Мохика зализал раны и подал статью на рассмотрение в другой журнал… и еще в другой. Три журнала, включая Proceedings of the National Academy of Sciences (PNAS), отказались от CRISPR. Каждая задержка публикации увеличивала вероятность, что Мохику обойдут конкуренты. Наконец в октябре 2004 г. он отправил рукопись в малоизвестный журнал, специализирующийся на эволюции. Прошло целых полгода, прежде чем он получил одобрение от редактора. Три месяца спустя его статья была принята в печать. «Эти два года были для меня кошмаром, – рассказывает он. – Когда у вас в руках есть что-то настолько сенсационное и вы отправляете это в очень хорошие журналы – и все они решают, что это недостаточно интересно для публикации, – вы думаете, я что, сумасшедший? или здесь что-то не так?»[102]