Раз фамилии картографируются так же, как и все остальное в геногеографии, значит с картами фамилий можно проводить дальнейший анализ — комбинировать их и в обобщённые карты главных компонент, и в карты инбридинга.
7) РАСЧЁТ СЛУЧАЙНОГО ИНБРИДИНГА. Это показатель весьма важный — он измеряет степень подразделённости популяций, и, кроме того, степень «огомозигочивания» (снижения гетерозиготности), что даёт прогноз груза рецессивных наследственных болезней. Этот традиционный для «фамильной генетики» расчёт мы провели для всех русских популяций. Результирующая карта показывает невысокие значения инбридинга на юге, и его возрастание к северо-востоку «исконного» русского ареала.
ОТСЕВ РЕДКИХ ФАМИЛИЙ
Наш обзор мы начали с числа 67 000 — именно столько обнаружилось русских фамилий. Но отражают ли они «только коренное» население, как требуется в геногеографии, обращенной к истории генофонда? При сборе генетических и антропологических данных мы спрашиваем каждого человека, где родились его родители и предки. Тех, кто происходит из данной местности («коренное население») мы включаем в выборку. А тех, у кого есть предки издалека — отсеиваем («пришлое население»). Так мы делим на коренное и на пришлое население при анализе генов. Но при анализе фамилий мы не можем опросить каждого из миллиона человек!
Вместо прямого опроса, все исходные данные о фамилиях мы пропустили через сито демографического критерия. В результате из примерно миллиона человек осталось около 700 тысяч человек — остальные триста тысяч оказались носителями фамилий, которые нигде, ни в одном районе не достигают численности даже в пять человек. Эти фамилии мы расцениваем как вероятно «пришлые» в изученных популяциях, а потому неинформативные для анализа коренного населения. Таких фамилий оказалось очень много: из 67 тысяч отсеялось пятьдесят три тысячи! Осталось лишь 14 тысяч фамилий, которые мы расцениваем как коренные — и только эти фамилии используются в большинстве видов анализа.
Стоит задуматься, не слишком ли много мы потеряли при таком отсеве? Скорее всего, нет. Ведь хотя мы отсеяли 75 % фамилий, но общее число человек снизилось только на 25 %. Именно потому, что эти фамилии очень редкие, их носителей не так много. Не включая их в анализ, мы скорее избавляемся от случайных помех, чем теряем ценную информацию о генофонде. Ведь наша цель — изучение фамилий не ради них самих, а ради изучения генофонда.
ФАМИЛИИ НЕ РАДИ ФАМИЛИЙ
Начиная наше изучение русских фамилий, мы стремились получить новые знания о структуре русского генофонда. Однако в процессе изучения обнаруживалось столько любопытных и удивительных свойств фамилий, что наше исследование стало во многом методическим: мы освоились с таким типом маркёров как фамилии, придумали и опробовали новые методы их анализа. Теперь пора оглянуться и посмотреть, какие же конкретные знания о русском генофонде это нам дало.
Главным является, пожалуй, информация о степени сходства разных регионов: сходство популяций среднерусской полосы, особость юга и севера. Важны и данные о Сибири: отсутствие своеобразия генофонда современного русского населения Сибири, его приближённость к усреднённому русскому генофонду, и в особенности к регионам средней полосы, и из них в первую очередь к Западному.
Карта инбридинга — второй важный результат — показывает его возрастание к северу и востоку. Значит, именно в этом направлении растёт подразделённость русского генофонда — восточные и северные популяции более изолированы друг от друга, и вероятно, меньше по численности и занимаемому ареалу, чем популяции того же ранга на западе и юге.
Наконец, третьим важнейшим результатом стали карты главных компонент. Для прочих типов признаков (классических маркёров, антропологии, Y хромосомы) карты главных компонент были главным обобщающим результатом. Теперь и фамилии встают в строй, становясь ещё одним очевидцем в «мультиокулярном» подходе, ещё одним свидетелем структуры генофонда. И карты главных компонент фамилий тоже показывают нам изменчивость, близкую к широтной, не противореча остальным свидетелям. Но в отличие от главных компонент по остальным системам, главные компоненты фамилий куда более своеобразны.
Это вызвано, прежде всего, тем, что анализ главных компонент мы смогли провести лишь по 75 фамилиям, а среди этих фамилий непропорционально много «календарных» и слишком мало фамилий, характерных для северного и южного регионов. Скорее всего, именно поэтому широтная изменчивость на картах фамилий оказалась затушёвана. Это окончательно прояснится в будущем, когда мы изучим недостающие регионы и сможем построить главные компоненты не по 75, а по всему множеству фамилий. Пока же первая главная компонента изменчивости фамилий выявляет распространение именно календарных фамилий. Именно они вносят основной вклад в первую компоненту, которая, как и календарные фамилии, сильно смещена к западу.
ЧТО ДАЮТ ФАМИЛИИ?
Что же нам дало изучение русских фамилий? Мы не будем повторять все те результаты, которые касаются фамилий как таковых. Мы посмотрим, что это дало для изучения русского генофонда.
Во-первых, фамилии оказались ещё одним — и парадоксально надёжным! — источником сведений о структуре генофонда. Они подтвердили различия между южными и северными русскими популяциями при меньших различиях между западными и восточными. При анализе других систем этот вывод следовал из главных компонент. При анализе фамилий он угадывается в компонентах и ясно виден на графиках сходства регионов. Фамилии дали дополнительную информацию и по многим более частным вопросам, уточняя и проясняя структуру русского генофонда.
Но, во-вторых, и в главных, «показания» фамилий оказались удивительно сходными с показаниями генов. Чего стоит, например, одна лишь высокая корреляция (r=0.6) между матрицами расстояний по фамилиям и по гаплогруппам Y хромосомы! Это неизменное сходство результатов, полученных по фамилиям и по генам, подводит к новому подходу, новому плану использования фамилий: сначала разведка структуры генофонда с помощью фамилий — и лишь затем планирование собственно генетических исследований. Ведь фамилии можно изучить тотально — для всех популяций, а в популяции для каждого человека. То есть сделать именно то, что невозможно сделать по генам.
Поэтому можно сперва провести разведку боем: изучить структуру генофонда по данным о фамилиях, выявить основные закономерности, основные «кластеры» популяций — и уже по этим данным планировать изучение генофонда по генетическим маркёрам.
Например, разумно было бы изучать по одной популяции из каждого кластера, выявленного фамилиями, чтобы охватить основное разнообразие генофонда. Тем самым фамилии не дадут упустить при генетическом обследовании ни одну из своеобразных, отличающихся групп. А именно эта опасность — постоянная головная боль полевого исследователя генофонда.
Можно предложить и ещё одно яркое применение фамилий — для изучения переселенческих генофондов. Предположим, какая-то группа населения сформировалась за счёт миграций из нескольких источников, нескольких «материнских» групп. И, зная частоты генов в материнских группах и располагая данными по фамилиям, мы можем узнать частоты генов в переселенческой группе, не изучая её! Для этого нужно по данным о фамилиях установить, какие группы являлись материнскими и в каком соотношении они смешались в переселенческой группе. А дальше остаётся усреднить частоты генов в материнских популяциях, взвесив их на полученные по фамилиям «коэффициенты миграции» в переселенческую группу.
Конечно же, польза от фамилий не исчерпывается помощью в планировании исследований для генетики или в изучении «переселенческих» генофондов. Главным результатом своей работы с фамилиями авторы хотели бы видеть широкое распространение этого типа маркёров и в теории, и в практике исследований разных генофондов.
Часть 3. РУССКИЙ ГЕНОФОНД В КРУГУ СОСЕДЕЙ: МНЕНИЯ РАЗНЫХ НАУК