Итак, что мы изучили и что это даёт?
ФАМИЛИИ — ГЕНЫ
Фамилии — привычный инструмент для популяционной генетики. Как зарубежные, так и отечественные генетики охотно использовали их для изучения структуры генофонда, в том числе для прогноза инбридинга. Недавно интерес к фамилиям усилился — благодаря сопряженности фамилий и Y хромосомы, которые должны наследоваться параллельно по отцовской линии и, действительно, нередко ведут себя согласованно. Фамилии широко изучались и у нас в стране. Научная школа Ю. Г. Рычкова преимущественно сравнивала дифференциацию генофонда, рассчитанную по фамилиям и по генам, и всегда обнаруживала совпадения. А научная школа Е. К. Гинтера применяла фамилии чаще всего для оценки инбридинга, и в том числе А. А. Ревазову мы обязаны термином «квазигенетические» маркёры — фамилии как «почти гены». Если считать, что фамилия наследуется от отца к сыну и далее в поколениях (что в большинстве случаев совершенно справедливо!), и если знать частоты фамилий в популяциях (а собрать такие сведения вполне реально), то частоты фамилий можно рассматривать как частоты аллелей, и применить к фамилиям все обычные методы популяционной генетики.
МАТЕРИАЛЫ
Именно таким образом было изучено много народов, в том числе и русские популяции. Наше исследование продолжает ту же традицию, но — если позволено так сказать — на огромном материале, организованном по-новому и проанализированном целым арсеналом новых методов. Мы теперь знаем о русских фамилиях столько, сколько раньше и не надеялись узнать. Материал представляет собой частоты фамилий, которые основываются на тотально изученном населении (практически каждый житель!) пяти основных регионов.
Для хранения и обработки этого огромного массива данных разработана специальная база данных о русских фамилиях, программа «ONOMA» и ряд других программ. А в сборе информации о фамилиях авторам по их просьбе помогали их коллеги Н. Н. Аболмасов, И. В. Евсеева, М. Б. Лавряшина, Э. А. Почешхо-ва, И. Н. Сорокина, М. И. Чурносов и многие другие.
Преувеличивая, можно было бы сказать, что учтена фамилия каждого русского человека — если бы не два ограничения. Во-первых, мы изучаем коренное население — это общий принцип изучения генофонда. Применительно к фамилиям это значит, что изучаем только сельское население и только в пределах «исконного» русского ареала. Центральная Россия и Русский Север изучаются, а Урал, Сибирь, Аляска и прочие «не исконные» русские территории — нет. Второе ограничение в том, что даже «исконный» ареал мы пока не изучили полностью, а выбрали семь областей из двух десятков областей исторического ареала. Эти семь областей группируются в пять регионов: Северный (Архангельская область), Восточный (Костромская область), Центральный (Кашинский район Тверской области), Западный (Смоленская область) и Южный (Белгородская, Курская и Воронежская области). В областях, как правило, изучено по несколько районов, а эти районы уже изучены тотально — собраны данные обо всём сельском населении этих районов. В дополнение к этим пяти основным регионам мы изучили три «окраинных» региона — Северо-Западный (Псковская область), кубанские казаки (Адыгея) и «Сибирь», представленную Кемеровской областью.
Эти два ограничения делают наше исследование не «тотальным» (чтобы так сказать, нужно изучить фамилии каждого из 116 миллионов русских), а субтоталь-ным — изучен «всего лишь» один миллион человек. Но этот миллион дорогого стоит — он представляет сельское население географически отдалённых друг от друга в среднем на 1000 км важнейших регионов «исконного» исторического ареала русского народа. Поэтому мы считаем, что эти данные весьма хорошо представляют русский генофонд.
Для выявления основных, базовых закономерностей русских фамилий этих данных оказалось достаточно. Но по мере углубления в специальные вопросы, особенно в географию фамилий и в подробное изучение географической структуры генофонда, растёт нужда в пополнении исходной информации — необходимо собрать данные о частотах фамилий в остальных областях «исконного» русского ареала, а возможно, и за его пределами. Авторы надеются, что эти данные будут со временем собраны, а пока предлагают ознакомиться с общими, базовыми результатами, извлечёнными из уже собранного огромного массива материалов.
БАЗОВЫЕ РЕЗУЛЬТАТЫ
1) Составлен список всех встретившихся фамилий, которых оказалось 67 тысяч. По мере сбора новых данных этот список будет расти, но уже сейчас, изучив восемь контрастных регионов, мы знаем основное разнообразие русских фамилий.
2) Бросается в глаза, насколько эти фамилии различаются по частоте. Одни настолько часты, что в среднем каждый сотый житель русского ареала — Кузнецов, каждый семьдесят пятый — Иванов, а почти каждый пятидесятый — Смирнов. Другие фамилии столь редки, что в том районе, где обнаружена фамилия, а порой и во всём русском ареале есть лишь считанные её носители.
3) Для многих фамилий мы построили карты их распространения. На картах видно, что почти каждой русской фамилии свойственно иметь свою географическую зону распространения, а не покрывать причудливой мозаикой русский ареал. Например, Петровы чаще всего встречаются на севере и западе, а для прочих территорий эта фамилия редкая. Такие зоны распространения могут быть удивительно компактны, а могут занимать обширные области. Для многих фамилий зоны очерчены чётко. Но для некоторых зоны прерывистые, неясные, и встречены даже фамилии распространённые то здесь, то там без всякой видимой закономерности. Правда, как раз они являются исключением, подтверждающим общее обнаруженное правило: русским фамилиям свойственно иметь определённые зоны распространения.
4) И спектр встреченных фамилий, и их частоты различаются от региона к региону. Оказалось, что все регионы средней полосы (Западный, Центральный и Восточный) похожи друг на друга. Южный регион заметно от них отличается. Но особенно своеобразен Северный регион. А вот Сибирский регион, хотя географически он самый отдалённый, по частотам фамилий очень близок к регионам средней полосы. Более того, Сибирский регион ближе всех к усреднённым русским показателям. Этот парадокс объясняется просто — Сибирь не является частью «исконного» ареала, её население — это переселенцы из «исконного» ареала, причём из самых разных его частей. Именно «плавильный котел», в котором смешались выходцы из самых разных частей «исконного» ареала, и произвёл «среднерусский» сплав: присутствие в Сибири самых разных фамилий с частотами, близкими к среднерусским частотам этих фамилий.
5) «Осмысленные классы» создают «осмысленный» портрет региона. Результаты сравнения регионов по частотам фамилий совпали с независимым сравнением регионов по семантическим классам фамилий.
«ОСМЫСЛЕННАЯ» КЛАССИФИКАЦИЯ ФАМИЛИЙ
Классифицирование фамилий — совсем новый подход в генетике. Обычно популяционно-генетические работы рассматривают все фамилии как равноправные признаки, неразличимые, одинаковые, безликие. И мы, сравнивая регионы по частотам фамилий, поступили точно так же. Такой статистический подход позволяет рассчитать все показатели, которые мы рассчитываем по генам. Но мы предложили дополнить его иным, новым подходом, который назвали семантическим.
Его суть очень проста: надо вглядеться в лицо каждой фамилии, и отнести её к одному из классов. Например, при статистическом подходе фамилии Иванов, Петров, Никитин, Волков, Зайцев и Курочкин для нас совершенно равноправны. А при семантическом подходе Ивановых, Петровых и Никитиных мы отнесем к фамилиям, производным от имён, а Волковых, Зайцевых и Курочкиных — к фамилиям, образованным от зверей. И будем анализировать их раздельно.
Важным показателем тогда станет соотношение разных классов в спектре фамилий. В нашем примере оказалось три фамилии от имён и три «от зверей». Но в другой популяции это соотношение может быть инное. Например, на северо-западе почти все фамилии окажутся производными от имён. Это означает, что мы получаем в руки совершенно новую характеристику популяций, обогащаем свои знания и открываем новый метод. Такой семантический подход не имеет аналогий в анализе генов. Это характерная черта, особое богатство, свойственное анализу фамилий, благодаря тому, что они расцвечены красками языка и несут смысловую нагрузку.