Новая датировка праиндоевропейского языка
Более надежный и последовательный способ датировки языков, в котором давно нуждается наука, предлагают ученые, взявшие за основу технологию выстраивания филогенетических деревьев. Этот способ именуют «методом наибольшего правдоподобия»: он начинается с вопроса, какова наиболее вероятная форма дерева, объединяющего наблюдаемые факты. В случае языковых семей фактами служат разноязыковые списки Сводеша с уточнением, какие слова в них когнаты, а какие нет.
Применить метод наибольшего правдоподобия к истории языков впервые предложил Марк Пейгл, биолог из Университета Рединга (Англия). Он показал, что, располагая списком всего из 18 слов, можно составить максимально правдоподобное дерево для семи языков (валлийского, румынского, испанского, французского, немецкого, голландского и английского), и его дерево оказались ровно таким же, какое получили компаративисты чисто лингвистическими методами{279}.
Недавно метод наибольшего правдоподобия усовершенствовал биолог из Оклендского университета Рассел Грэй. Он тщательно разобрал слабые места глоттохронологии и усовершенствовал метод именно с тем, чтобы компенсировать их. Одна из проблем – неопознанные заимствования. Из-за них язык может показаться моложе, чем он есть. Но вместе с тем они связывают побочные ветви языка, создавая сетевидную структуру. Такие структуры можно выявить, и затем отсеять неопознанные заимствования.
Другое узкое место глоттохронологии – то, что языки эволюционируют в разном темпе. Современные исландский и норвежский происходят от древнескандинавского, на котором люди говорили между 800 и 1050 гг. н. э. У норвежского с древнескандинавским 81 % слов из списка Сводеша – когнаты, что верно указывает на разделение 1000 лет назад. Однако современный исландский, развивающийся более обособленно, на 99 % состоит из слов древнескандинавского – ложное указание на то, что языки разошлись всего 200 лет назад{280}.
Математические методы для выявления заимствований и учета колебаний в темпах языковой эволюции уже существовали, потому что с теми же трудностями сталкивались и биологи, составлявшие генеалогии на основе данных ДНК. Как и языки, некоторые гены эволюционируют быстрее прочих. И как слова могут быть унаследованы либо заимствованы, гены тоже достаются организму не только от родителей, но и «со стороны»: например, бактерии умеют обмениваться сериями генов и именно поэтому так быстро приобретают устойчивость к антибиотикам.
Одна из форм метода наибольшего правдоподобия, так называемый байесов метод Монте-Карло с цепями Маркова, на который сегодня делают ставку биологи, состоит в том, что последовательности ДНК разных генов вводят в компьютер и получают большое множество деревьев, которые могли бы связывать эти гены. Затем программа берет образцы из тех групп деревьев, которые выглядят наиболее перспективными (задача проверить каждую пока не под силу даже самым быстрым компьютерам), и раз за разом повторяет тот же алгоритм. С каждой итерацией перспективных деревьев становится все меньше, и в итоге процесс выдаст одно, наиболее вероятное дерево, объясняющее наличные данные.
При помощи этой мощной технологии Грей и его коллега Квентин Аткинсон нарисовали фамильное древо индоевропейских языков. В качестве контрольных данных они взяли список Сводеша из 200 слов для 84 индоевропейских языков, составленный лингвистом Исидорой Дайен, и дополнили его примерами из трех мертвых языков: хеттского и двух разновидностей тохарского, так называемых тохарского A и тохарского Б.
В генетике генеалогическое древо зачастую можно привязать к ленте времени, соотнеся одну из его ветвей с датами палеонтологических находок. То же самое можно проделать и с деревьями языков, сконструированными по методу наибольшего правдоподобия. Обнаружив статистически наиболее вероятное дерево для данных индоевропейской семьи, Грей произвольно совмещал определенные развилки на нем с подтвержденными датами расподобления языков. Хеттский, несомненно, был самостоятельным языком к 1800 г. до н. э., которым датируется старейшая из известных хеттских надписей. Древнегреческий отделился к 1500 г. до н. э., времени создания надписей линейным письмом Б[11]. Латинский и румынский языки начали разделяться в 274 г., когда римские войска ушли из нижнего Подунавья.
Древо индоевропейской языковой семьи составлено Расселом Греем и Квентином Аткинсоном с применением передового статистического метода. Древо соотнесено с 14-ю известными датами возникновения недавно появившихся языков, что позволило приблизительно датировать и древние ветви. Цифры обозначают, сколько лет прошло с того момента, когда язык ответвился от родительской линии.
Согласно Аткинсону и Грею, язык-прародитель, в лингвистике называемый праиндоевропейским, 8700 лет назад разделился на две ветви, и первым ответвлением стал хеттский. Ранняя дата появления праиндоевропейского языка свидетельствует о том, что говорил на нем народ, принесший земледелие с Ближнего Востока в Европу.
Английский входит в германскую языковую ветвь, так же как голландский, шведский и исландский. Романская ветвь включает в себя французский, итальянский и испанский. Русский, чешский и литовский относятся к балто-славянской ветви. Хеттский, ныне исчезнувший, был языком хеттской империи, располагавшейся на территории нынешней Турции; тохарский бытовал в западном Китае.
Источник: автор Квентин Аткинсон, Оклендский университет, Новая Зеландия
Всего Грей использовал 14 известных дат, составив древо так, чтобы оно соответствовало этим датам статистически наиболее вероятным образом. Поскольку длина основных ветвей на древе пропорциональна истекшему времени, его привязка к историческим событиям позволяет датировать и остальные ответвления. Составленное Греем древо опубликовал в ноябрьском номере 2003 г. журнал Nature, довольно лаконично описав весьма непростую технологию, использованную ученым{281}. Поначалу многие компаративисты не увидели в работе Грея ничего нового: его древо индоевропейской семьи в точности совпадало с тем, которым пользуется лингвистика. Однако, по мнению Грэя, сам этот факт и был лучшим признанием его метода.
Новым в древе Грея была не форма, но даты. Они далеко расходились со всеми представлениями лингвистов. Согласно генеалогии Грея, праиндоевропейский язык звучал на земле еще 8700 лет назад, а вернее, в этот момент он уже переживал первый раскол, когда от языка-родителя отошла ветвь, ставшая хеттским языком. Это примерно на 3000 лет раньше того времени, к которому относили распад общего праязыка на отдельные ветви многие компаративисты.
Датировка Грея, если она верна, – это своего рода переворот, потому что при таком раскладе корни индоевропейцев много старше, а историю языка можно проследить значительно глубже, чем то допускает большинство лингвистов. К тому же, имея надежный метод датировки, можно будет, наконец, соотнести трансформации языков с данными археологии и популяционной генетики.
Многие лингвисты считают, что данные Грея не могут быть верными прежде всего потому, что расходятся с данными лингвистической палеонтологии. Однако лингвистическая палеонтология – это приблизительная и субъективная методика, уязвимая для нераспознанных заимствований и искусственных реконструкций. Метод Грея прибегает к тонким статистическим технологиям, доказавшим свою ценность в филогенетике, и к проверенному массиву данных, списку Дайен, продукту серьезного научного исследования в индоевропеистике. Да, новаторская система может потребовать дальнейшей доработки или обнаружить какие-то неожиданные огрехи. Но в сравнении с лингвистической палеонтологией она не выглядит менее надежной.