Литмир - Электронная Библиотека

7.6. «ФАМИЛЬНЫЙ ПОРТРЕТ» РУССКОГО НАРОДА

§ 1. Различия и сходство регионов: В анализе 14 000 коренных фамилий — Сходство фамилий средней полосы — Своеобразие «полярных» регионов — Подтвердился анализ «топ-20» и «осмысленных» классов «топ-50»!

§ 2. Фамилии и маркёры Y хромосомы: Индивиды: похожи ли Y хромосомы у однофамильцев? — Популяции: фамилии и генофонд — На Русской равнине география фамилий и Y хромосомы сходна — Высокая корреляция между матрицами расстояний для «настоящих» генов и для фамилий

§ 3. «Главные сценарии» изменчивости: Среднерусская полоса — Постепенное изменение фамилий к югу — Своеобразие Русского Севера — Корреляции «главных сценариев» фамилий, антропологии и генетики

§ 4. География инбридинга: Как узнать инбридинг по фамилиям? — Прогноз груза наследственных болезней — Русский генофонд — Неуклонный рост инбридинга с юго-запада на восток

§ 5. Основные черты «фамильного портрета»: «Осмысленная» классификация фамилий и регионов — Парадоксально надёжные маркёры — Фамилии не ради фамилий — Лицо генофонда — Разведка боем

Как и в предыдущих главах второй части книги, заключительный раздел вбирает те виды анализа, которые абстрагируются от отдельных признаков и выявляют общие черты генофонда. Это позволяет нам забыть на время о том, какими именно признаками мы пользовались, и вглядеться, наконец, в тот общий план строения русского генофонда, который проявляется в рассматриваемом типе признаков.

В. этой главе есть и уже привычные карты главных компонент — «главных сценариев» изменчивости генофонда (£?). Однако для фамилий этот параграф не центральный. Дело в том, что карты «главных сценариев» пока предварительные — они опираются на небольшой набор фамилий (75) и лишь половина популяций надёжна («районного масштаба»).

Поэтому основной акцент мы сделаем на другом виде анализа — на выявлении соотношений между основными частями генофонда по всем 14 тысячам коренных фамилий сразу. Такую оценку различия и сходства регионов (§ 1) мы получим с помощью обобщённых расстояний между регионами и диаграмм многомерного шкалирования — то есть так же, как в предыдущей главе для маркёров митохондриальной ДНК и Y хромосомы.

Это позволит нам сравнить обобщённые расстояния, рассчитанные по фамилиям, с генетическими расстояниями между теми же регионами, рассчитанными по маркёрам Y хромосомы (§ 2). Такое сравнение, во-первых, интригующе интересно — ведь оба типа признаков передаются по отцовской линии. А во-вторых, мы имеем редкую возможность сравнить их без карт — и фамилии, и Y хромосома изучены нами в одних и тех же русских популяциях.

А вот последний вид анализа можно провести только по фамилиям. Это — прогноз инбридинга и связанного с ним груза наследственной патологии (§ 4).

Все виды анализа вместе помогут составить обобщённый «фамильный портрет» русского генофонда.

§ 1. Различия и сходство регионов

ВЕСЬ ФОНД ФАМИЛИЙ

Каков портрет русского генофонда, рисуемый не оттенками двух-пяти десятков самых частых фамилий, а разноцветьем всего многотысячного спектра русских фамилий? Как по всему спектру фамилий русский генофонд подразделяется на региональные части? Каковы соотношения между региональными «фамильными фондами»? Отвечая на эти вопросы, мы можем располагать данными лишь о пяти регионах «исконного» ареала, поэтому структура генофонда выявится лишь в общих чертах. Но именно эти общие черты для нас сейчас и важны. В последующих разделах (§ 2 и § 3) картографирование по данным о 100 популяциях поможет взглянуть на детали структуры генофонда.

Чтобы оценить истинные «взаимоотношения» регионов, мы включили в анализ весь фонд «коренных» фамилий. Использованы данные по всем фамилиям — и всеобщим, и уникальным. Единственное условие — анализируемые фамилии должны быть «коренными», чтобы мятущиеся ветры миграций не создавали эфемерную видимость близости или удалённости популяций.

АЛГОРИТМЫ АНАЛИЗА

МЕРА СХОДСТВА. Напомним, что в предыдущих разделах этой главы для выявления сходства и различий регионов по частым фамилиям («топ-10» или «топ-50»,) мы использовали самые разные показатели, чтобы максимально сохранить «лицо» фамилий, сравнить их «поимённо». Но теперь, при обобщённом анализе всего фонда фамилий, мы воспользуемся общепринятой в популяционной генетике мерой сравнения популяций — генетических расстояний М. Nei (1975).

АЛГОРИТМ РАСЧЕТА. Напомним, что в анализ включена информация о распространении 14 тысяч «коренных» фамилий. Носители этих фамилий — 725 тысяч человек из пяти основных регионов «исконного» ареала. «Пришлые», случайные и потому редкие для данного района фамилии отсеяны согласно «демографическому» критерию (раздел 7.3., § 2).

Частоты фамилий (см. разделы 3.2. и 7.2.) были сначала рассчитаны для каждого района. По совокупности «районных» частот рассчитаны невзвешенные частоты фамилий в регионе. По региональным частотам рассчитаны генетические расстояния между регионами. По этой матрице расстояний построен график многомерного шкалирования.

КТО НА КОГО ПОХОЖ?

Степень сходства пяти основных регионов друг с другом показана на рис. 7.6.1.

Русский генофонд на Русской равнине - img_143

Рис. 7.6.1. Сходство и различия пяти основных регионов по всем «коренным» фамилиям (14 428 фамилий).

Диаграмма многомерного шкалирования построена по обобщённым генетическим расстояниям [Nei, 1975].

СЕВЕРНЫЙ РЕГИОН (среднее расстояние от остальных регионов dN=1.1)[48] оказался наиболее своеобразным. Примечательно, что он удалён от всех регионов без исключения (1.0<dN<1.4). Более всего Северный регион по частотам фамилий отличается от географически близкого ему Восточного региона: генетическое расстояние между ними (dN-E=1.4) достигает вообще максимальной величины из расстояний между всеми парами регионов. Такое явное рассогласование географических и генетических расстояний подчеркивает, что распределение фамилий вовсе не является простой функцией от географического расстояния между популяциями. Такое рассогласование между географическими и генетическими расстояниями обычно свидетельствует о вмешательстве истории.

ЮЖНЫЙ РЕГИОН (ds=1.0) занимает второе место по своеобразию фамилий. Он также расположен на периферии «фамильного пространства» (рис. 7.6.7.). «Южные» фамилии ближе всех к «западным», но расстояние и между ними немалое (dS-W=0.7).

ВОСТОЧНЫЙ РЕГИОН (dE=0.9) оказывается на третьем месте по своеобразию фамилий. Он максимально удалён от обоих «полярных регионов» (в среднем dE-POLE=1.3). Но при этом близок к другим двум регионам среднерусской полосы (в среднем dE-MIDDLE ZONE=0.5). Из этих двух регионов он особенно близок к соседнему Центральному региону (dE-C=0.3). Так что в пределах среднерусской полосы Восточный регион не обнаруживает рассогласования с географическими расстояниями, а напротив, строго следует им. Видимо, здесь география и история были согласны друг с другом.

ЗАПАДНЫЙ РЕГИОН (dw=0.7) регион оказывается равноудален от Южного (dW-C=0.7) и Восточного (dW-E=0.8) регионов, и близок к Центральному (dW-C=0.3).

ЦЕНТРАЛЬНЫЙ РЕГИОН (dc=0.7) занял действительно центральное место в русском генофонде. Он почти в равной степени удалён от «полярных регионов» (dC-N=1.1; (dC-S=0.9) и одинаково близок к регионам средней полосы (dC-W=0.3; dC-W=0.3). Однако, хотя кажется, что здесь географические и генетические расстояния полностью ладят друг с другом, но история вмешивается и здесь. Генетические расстояния до регионов средней полосы оказались в три-четыре раза меньше, чем до «полярных». А разница в географических расстояниях невелика — лишь в полтора раза (Центр/3апад=400 км, Центр/Востоk=450 км, Центр/ Юr=600 км, Центр/Север=700 км). Таким образом, по частотам фамилий Центральный регион куда более удалён от полярных регионов, чем ожидалось из географии.

121
{"b":"970748","o":1}