Литмир - Электронная Библиотека
Содержание  
A
A

Один из коллег как-то сказал про Ципфа, что тот «может ощипать прекрасную розу, чтобы сосчитать ее лепестки». С литературой Ципф обходился столь же бесцеремонно. Будучи студентом, он взялся за «Улисса» Джойса, и главное, что он вынес оттуда, – роман состоит из 260 430 слов, 29 899 из которых различны. Так же Ципф препарировал «Беовульфа», Гомера, тексты китайской литературы и творчество римского драматурга Плавта. Подсчитывая слова в каждом из произведений, он открыл закон Ципфа. Он гласит, что наиболее распространенное слово в языке встречается примерно вдвое чаще, чем второе по распространенности, примерно втрое чаще, чем третье, в сто раз чаще, чем сотое по распространенности, и т. д. В английском языке слово «the» составляет примерно 7 % от всех слов, «of» – примерно половину от этого, «a» – треть от этого и т. д., вплоть до экзотических слов типа «бустрофедон». Такое распределение соблюдается во всех языках – от санскрита и этрусского до современных хинди, испанского или русского (эти языки Ципф анализировал по прейскурантам каталогов от компании «Сирс»). Закон Ципфа действует даже по отношению к искусственным языкам.

Уже после смерти Ципфа в 1950 году ученые обнаружили свидетельства того, что его закон соблюдается отнюдь не только в языке. Его также можно проследить: в музыке (подробнее об этом расскажем чуть позже), списках городов по численности населения, распределении доходов, массовом вымирании живых существ, магнитудах землетрясений, соотношении различных цветов в картинах или мультфильмах и т. д. В каждом случае самый большой или самый распространенный из элементов был вдвое больше/распространеннее второго в списке, втрое – третьего и т. п. Внезапная популярность этой теории ожидаемо привела и к обратной реакции, особенно среди лингвистов, которые часто ставят под сомнение само существование этого закона[18]. В то же время многие другие специалисты защищают этот закон, так как он видится корректным – частота слов не кажется случайной – и, опытным путем, описывает языки со сверхъестественной точностью. Даже «язык» ДНК.

Конечно, соблюдение закона Ципфа в случае с ДНК на первый взгляд не кажется очевидным, особенно для носителей западноевропейских языков. В отличие от большинства языков ДНК не имеет очевидных пробелов, помогающих отличать каждое слово. Это скорее напоминает тексты древних рукописей, без каких-либо пробелов, пауз и без единого знака препинания, бесконечные строки букв. Можно предположить, что триплеты, состоящие из А, Ц, Г и Т, которые кодируют аминокислоты, могут выступать в качестве «слов», но их соотношение совсем не похоже на ципфианское. Чтобы найти действие закона Ципфа, ученым пришлось обратить внимание на группы триплетов, и в этих поисках некоторые специалисты обратились к необычным помощникам: китайским поисковым системам. Китайский язык создает сложные слова путем связи соседних символов. Так, если в китайском тексте написано АБВГ, поисковые системы могут выступать своеобразным раздвижным окном, в котором помещаются найденные значимые отрывки: сначала АБ, БВ и ВГ, затем АБВ и БВГ. Использование принципа «раздвижного окна» оказалось неплохой стратегией для поиска значимых отрывков ДНК. Оказалось, что, в каком-то смысле, ДНК выглядит даже более ципфианской, чем язык, в группах, каждая из которых насчитывает до двадцати оснований. В общем, возможно, что наиболее значимой единицей для ДНК может быть не триплет, а четыре триплета, работающих сообща, – додекаэдрный мотив.

Выражение ДНК и ее трансляция в белки также подчиняются закону Ципфа. Как и распространенные слова, некоторые гены в каждой клетке появляются снова и снова, в то время как большинство генов вряд ли примут участие в конверсии. На протяжении веков клетки учились полагаться на эти общие белки все в большей и большей степени, и наиболее распространенные из них появлялись вдвое, втрое, вчетверо раз чаще, чем белки, следующие по популярности. Честно говоря, многие ученые хмыкают, что эти ципфианские фигуры вовсе ничего не значат; но другие специалисты говорят, что уже самое время признать: ДНК не только аналогична языку, но и реально функционирует, как язык.

И не только язык: ДНК обладает теми же ципфианскими свойствами, что и музыка. Возьмем тональность какого-нибудь музыкального отрывка, например до мажор, и убедимся, что определенные ноты там встречаются чаще остальных. Ципф действительно как-то исследовал преобладание тех или иных нот у Моцарта, Шопена, Ирвинга Берлина и Джерома Керна – и (внимание!) нашел ципфианское распределение! Позже исследователи подтвердили справедливость этих выводов и в других музыкальных жанрах, от Россини до Ramones, и обнаружили подобные пропорции не только во встречаемости нот, но и в тембре, и в громкости звука.

Однако если ДНК демонстрирует ципфианские тенденции, можно ли сказать, что цепочки организованы в своего рода партитуру? Музыкантам на практике удалось перевести А-Ц-Г-Т последовательность серотонина – химической составляющей мозга – в небольшие песенки, заменяя четыре символа ДНК нотами: ля (А), до (С), соль (G) и, поскольку буква T никакой ноте не соответствует, ми (Е). Другие музыканты составляли ДНК-мелодии, присваивая ноты звукоряда определенным аминокислотам, которые встречаются чаще остальных: это привело к появлению более сложных и приятных звуков. Второй метод укрепил идею, что ДНК, как во многом и музыка, лишь частично представляет собой строгую последовательность «нот». Она также определяется мотивами и темами, показывает, как часто появляются определенные последовательности и хорошо ли они взаимодействуют. Один биолог даже доказывал, что музыка – это природный посредник в изучении того, как комбинируются частицы генома, с тех пор как люди обзавелись четким слухом, чтобы улавливать, как фразы сообща действуют в музыке.

Нечто еще более интересное произошло, когда двое ученых, вместо того чтобы превращать последовательность ДНК в музыку, решили осуществить обратный процесс и перевели ноты ноктюрна Шопена в ДНК. Итогом опыта стала последовательность, «поразительно похожая» на часть гена РНК-полимеразы. Эта полимераза, белок, не меняющийся на протяжении всей жизни организма, и есть то, с помощью чего из ДНК строится РНК. А это, если посмотреть внимательнее, обозначает, что ноктюрн копирует весь жизненный цикл. Смотрите сами: полимераза использует ДНК для построения РНК. РНК, в свою очередь, строит сложные белки. Эти белки образовывают клетки, а из клеток происходят люди – такие, как Шопен. Композитор выполняет свою работу – создает гармоничную музыку, которая завершает цикл, кодируя ДНК на постройку полимеразы. Так музыковедение обобщает всю онтологию.

Является ли это открытие случайностью? Не совсем. Ученые утверждают, что впервые гены появились в ДНК не случайным образом, по какому-нибудь старому участку хромосомы. Вместо этого они начали дублироваться сразу в виде повторяющихся фраз, десятка-другого оснований ДНК, дублированных снова и снова. Эти участки функционируют как основная музыкальная тема, куда композитор добавляет всякие приятные излишества, побочные мелодии, с помощью которых создает приятно звучащие вариации на основе оригинала. Продолжая оперировать этими понятиями, заметим, что гены с самого начала имеют определенную «мелодию», на основе которой они и построены.

Люди давно хотели связать музыку с какими-то более глубокими, более грандиозными природными процессами. В частности, астрономы – начиная от древнегреческих и заканчивая Кеплером – верили, что небесный путь планет проходит через рай земной и что планеты создали безумно красивую музыку небесных сфер – гимн во славу творения. И оказалось, что универсальная музыка существует на самом деле, только гораздо ближе, чем мы себе представляли, – в нашей ДНК.

* * *

Генетика и лингвистика связаны не только законом Ципфа, но еще глубже. Мендель, до того как стать монахом, пробовал себя в лингвистике, в том числе пытался вывести точный математический закон по поводу того, как немецкие фамильные суффиксы (такие, как «-манн» или «-бауэр») скрещиваются с другими именами и воспроизводят себя в каждом поколении (звучит знакомо, не правда ли?) И, черт возьми, сейчас генетики не могут даже говорить о своей работе безо всех этих терминов, позаимствованных из изучения языков. У ДНК есть синонимы, переводы, пунктуация, префиксы и суффиксы. Мутации с изменением смысла (с заменой аминокислот) и с утратой смысла (с вмешательством стоп-кодонов) – это, как правило, «опечатки», а мутации, связанные со сдвигом рамки считывания (искажающие смысл триплетов) – это старомодные ошибки, связанные с нарушением работы типографии. В генетике даже есть свои грамматика и синтаксис: правила для комбинирования «слов» из аминокислот и сложения белковых «предложений», которые может прочитать клетка.

вернуться

18

Сам Ципф считал, что его закон показал нечто универсальное в человеческом разуме, а именно – лень. Он доказывал: при разговоре мы хотим тратить как можно меньше энергии для достижения цели, поэтому используем общеупотребительные слова, например «плохо», потому что они короткие и легко приходят на ум. Что мешает нам употреблять слова «низко», «мерзко», «фальшиво», «неподходяще», «ненавистно», «глупо», «вредно для мозгов» вместо слова «плохо»? Лень наших собеседников, которые не хотят тратить силы на то, чтобы различать все возможные значения слова. Они хотят, чтобы все было точно и как можно быстрее. Подобное «перетягивание каната» с ленью приводит к тому, что общеупотребительные слова делают львиную долю работы в любом языке, но более редкие и более наглядные слова тоже должны появляться здесь и сейчас – чтобы умиротворить занудных книгочеев. Само по себе это звучит толково, но многие исследователи утверждают, что любое «дотошное» объяснение закона Ципфа – это (используем другое общепринятое слово) фигня. Они отмечают, что распределение, подобное ципфианскому, может проявиться в любой хаотической ситуации. Даже компьютерные программы, выдающие случайные наборы букв и пробелов – цифровой вариант обезьян с пишущими машинками, – могут производить слова, частота которых будет соответствовать закону Ципфа.

20
{"b":"270832","o":1}