Литмир - Электронная Библиотека

КАК СРАВНИТЬ ПОПУЛЯЦИИ?

Сравнивать частоты гаплотипов, по всей видимости, нецелесообразно — слишком низка частота практически любого гаплотипа. И двукратные различия в частотах (в какой-то популяции один, а где-то встретилось два человека с таким гаплотипом) будут вызваны лишь случайностями выборки. Лучше сравнивать на качественном уровне: не важно, у скольких индивидов встречен данный гаплотип — важно, что он обнаружен в популяции. Тогда зависимость от объёма выборки будет меньше.

РАСЧЁТ ИНДЕКСА СХОДСТВА. Для каждой пары сравниваемых популяций мы подсчитывали число общих филогенетических линий (гаплотипов) мтДНК. Индекс сходства оценили как соотношение (долю общих линий): в числителе — количество линий мтДНК, общих с русскими популяциями; в знаменателе — суммарное число линий мтДНК, обнаруженных в сравниваемой популяции.

Такой способ расчёта, на первый взгляд, решает проблему «нерепрезентативности» любых наших выборок (в том смысле, что в них представлены далеко не все гаплотипы, реально присутствующие в популяции). Решает за счет того, что мы подсчитываем не число, а долю гаплотипов, общих между двумя популяциями. Ведь все гаплотипы имеют одинаковую вероятность «потеряться» (присутствовать в популяции, но отсутствовать в выборке). И если для изучаемой популяции «А» общие гаплотипы обнаруживаются преимущественно с популяцией «В», и реже с популяцией «С», то это означает, что таково реальное соотношение митохондриальных генофондов этих популяций. При этом мы предполагаем, что при увеличении объёма выборок число общих гаплотипов должно увеличиться в каждой сравниваемой паре популяций, но само соотношение останется примерно тем же.

КОВАРНАЯ СЦИЛЛА: В ЧЁМ ОШИБАЕТСЯ ИНДЕКС СХОДСТВА?

К сожалению, проверка показывает, что это не' вполне так. На рис. 6.2.4. приведена зависимость доли общих гаплотипов от объёма выборки (нижняя линия). Ясно видно, что такая зависимость имеется: чем меньше объём выборки, тем больше индекс сходства, тем больше доля общих гаплотипов.

ВЕРОЯТНОЕ ОБЪЯСНЕНИЕ. Можно предположить, что это вызвано наличием в популяциях сравнительно частых гаплотипов. Например, для населения Европы такими гаплотипами окажутся: в гаплогруппе Н гаплотип CRS и гаплотип с заменами «304–311»; в гаплогруппе J — гаплотип с заменами «069–126». Эти гаплотипы очень часты в Европе в целом, и поэтому встречены почти в каждой изученной европейской популяции. Число таких гаплотипов невелико. Но именно за счет своей повсеместности они всегда окажутся общими между любыми популяциями. Тем самым они являются как бы постоянной «прибавкой» к числу общих гаплотипов. И чем меньше объём выборки, тем больше сказывается это постоянное прибавочное число, тем больше оно завышает долю общих гаплотипов и повышает индекс сходства популяций.

Русский генофонд на Русской равнине - img_83

Рис. 6.2.4. Сходство популяций зависит от объёма выборки (при прямом подсчёте доли общих гаплотипов между популяциями Европы).

Примечание. Для десяти европейских популяций подсчитаны три показателя: общее число гаплотипов в них; число гаплотипов, общих с русскими популяциями; доля гаплотипов, общих с русскими популяциями. Все 10 рассматриваемых популяций характеризуются разными объёмами выборок. График показывает, как три перечисленных параметра (отложенных по оси ординат) зависят от объёма выборки (ось абсцисс). Общее число гаплотипов при увеличении объёма выборки возрастает. Число гаплотипов, общих с русскими, также возрастает. Доля гаплотипов, общих с русскими, снижается. Это снижение хорошо видно на аппроксимирующем графике (жирная пунктирная линия). Для совместимости на одном графике число общих гаплотипов приводится умноженное на 10, а доля — умноженная на 1000.

Справедливо ли такое объяснение или есть другие причины зависимости сходства популяций от объёма выборки, в любом случае из-за этой зависимости любые выводы повисают в воздухе. Достаточно увеличить выборку, и обнаруженное ранее сходство популяций исчезнет! Наименее похожими на русских окажется население тех стран, где генетические исследования проводятся более интенсивно, а наиболее сходными будут просто слабо изученные народы! Необходим способ расчёта, корректирующий эту зависимость.

ПРОКРУСТ СПЕШИТ НА ПОМОЩЬ

Нами использован, пожалуй, самый простой, прямой, а потому надёжный способ такой коррекции — Прокрустов. Все сравнения проведены на выборках одного и того же объёма. Чтобы выровнять объёмы выборок, из каждой случайным образом было отобрано одно и то же число образцов, и дальнейшие сравнения проводились именно с этими новыми выборками одинакового объёма. Естественно, при этом происходила потеря части данных — все выборки приходилось выравнивать по самой маленькой из них (по размеру прокрустова ложа). Тем не менее, только такой прокрустов подход («отрубать лишнее») позволяет нам быть уверенными, что полученные результаты не зависят от того, что какая-то популяция изучена по большей выборке, а отражают что-то более объективное, можно надеяться — реальное сходство популяций.

СРАВНЕНИЕ РЕГИОНОВ. А НЕ ЛОКАЛЬНЫХ ПОПУЛЯЦИЙ

Зная, какие гаплотипы встречены в каждой из русских популяций, можно было бы сравнить разные русские популяции и определить, какие из них наиболее сходны друг с другом. Похожий анализ мы проводили по данным о частотах гаплогрупп (§ 3). Но осторожность не позволяет нам сделать это по данным о гаплотипах: выборки по каждой популяции составляют 100–150 человек, что слишком мало для определения спектра гаплотипов. Поэтому мы не можем провести анализ внутри русского генофонда, сравнив между собой разные русские популяции. Но можем объединить данные по всем русским популяциям, получив многосотенную выборку. И сравнить такой общерусский спектр с аналогичными спектрами соседних групп населения (табл. 6.2.4).

НА КОГО МЫ ПОХОЖИ?

Начиная со сказки об изолах-миграх и до мифов Древней Греции, мы только делали предостережения самим себе — они ясно показывают, как легко выводы о генофонде могут оказаться несоответствующими реальности. Поэтому теперь во всеоружии и с максимальной осторожностью сравним спектр гаплотипов в русских популяциях и у их соседей по Европе.

Диаграмма (рис. 6.2.5.) показывает, что по степени сходства с русским генофондом его соседи располагаются в следующем порядке: восточные славяне, волго-финские народы, западно-финские народы, западные славяне, тюркские народы Урала, южные славяне, германоязычные народы, народы Кавказа.

То, что по спектру гаплотипов русские оказались похожи на прочих восточных славян, не удивительно. Однако западные и в особенности южные славяне заметно отличаются от русских. У финноязычных народов (как западных, так и волжских) несколько больше общих гаплотипов с русскими, чем у славянских народов! Это можно трактовать в терминах финно-угорского субстрата в русском населении. Тюркоязычные народы и население Кавказа, несмотря на тесное соседство с современной зоной расселения русских, имеют с ними меньше общих гаплотипов мтДНК.

Таблица 6.2.4.

Группы населения, сравниваемые с русскими по спектру гаплотипов

Русский генофонд на Русской равнине - img_84

Эти результаты показывают общность митохондриального генофонда Восточной Европы. Во всех языковых группах этого региона (восточные славяне, финно-угры, тюрки Уральского региона) мы видим общий массив гаплотипов мтДНК. Все эти группы народов по спектру гаплотипов похожи на русские популяции и, соответственно, должны быть и похожи друг на друга. На Кавказе и в Западной Европе спектр гаплотипов уже несколько отличается. Западные славяне, судя по рис. 6.2.5., присоединяются к восточноевропейскому кластеру, а южные славяне отличаются от него так же, как Кавказ и Западная Европа.

92
{"b":"970748","o":1}