Литмир - Электронная Библиотека

Для каждого образца содержится информация по ГВС1, а также (при наличии таких данных в оригинальных статьях) по ГВС2 и по информативным мутациям в кодирующем регионе мтДНК («ПДРФ маркёры»). В банк включены также сведения по изученным популяциям, включая их этническую (народ) и административную принадлежность (страна, провинция) и географические координаты.

ОПРЕДЕЛЕНИЕ ЧАСТОТ ГАПЛОГРУПП. Особенность всех митохондриальных баз данных в том, что информация содержится в формате «образец (из определённой популяции) — его гаплотип», а не в формате «популяция — частота аллеля (гаплогруппы)», обычном для популяционно-генетических баз данных. Соответственно, на первом этапе использования митохондриальной базы данных необходимо для каждого образца указать его гаплогруппу, и только потом можно рассчитать и картографировать частоты гаплогрупп. Однако определение гаплогруппы для огромного массива образцов, изученных разными авторами по различным наборам маркёров с использованием различающихся обозначений одних и тех же гаплогрупп, представляет собой сложную задачу.

Для создания Атласа митохондриальной ДНК Евразии (версия 2007 года) мы использовали следующий алгоритм. Для образцов, по которым имелись удовлетворительные данные о ПДРФ маркёрах кодирующей части мтДНК, гаплогруппы определялись по наличию характеристических мутаций в кодирующей части, то есть наиболее корректным путём. Для образцов, по которым имелись данные только по ГВС1 (или данные по обоим сегментам, и ГВС1, и ГВС2), гаплогруппа определялась по степени сходства данного гаплотипа со всеми гаплотипами, для которых надёжно известна гаплогруппа. В качестве такой референтной базы (обучающей выборки) использовались образцы, секвенированные полностью или подробно охарактеризованные по ПДРФ маркёрам. Например, если гаплотип данного образца по набору мутаций оказывался наиболее сходен с восемнадцатью другими гаплотипами, несомненно относящимся к гаплогруппе U4, то и рассматриваемый гаплотип мы относили к той же гаплогруппе. Такая операция проводилась программным путём (используя возможности MURKA database), при необходимости результаты проверялись и корректировались вручную (экспертная оценка). Такой способ достаточно эффективен и в большинстве случаев точен (как показано для похожего алгоритма [Behar et al., 2007]), но не гарантирует стопроцентное определение гаплогруппы. Действительно, если тестируемый образец сходен с двадцатью гаплотипами, относящимися к одной гаплогруппе, и с сорока гаплотипами другой гаплогруппы, то классифицировать наш гаплотип затруднительно. Во всех подобных случаях гаплогруппа не проставлялась (считалась неизвестной), и популяции, в которых доля таких неизвестных гаплогрупп превышала 1 %, не включались в картографический анализ. Впрочем, для ряда гаплогрупп (тех, для которых общепринято выделение по ГВС1) такого исключения популяций не проводилось, поэтому карты разных гаплогрупп основаны на несколько различающихся наборах популяций.

Такой алгоритм позволил гарантировать высокую надёжность исходных картографируемых данных (частот гаплогрупп) и при этом использовать все имеющиеся данные: как из работ, включавших обязательное определение ПДРФ маркёров, так и данные из многочисленных исследований, в которых проводилось лишь секвенирование ГВС1 (например, публикации лабораторий судебно-медицинской экспертизы). Использованные для картографирования частоты гаплогрупп представлены на сайте www.genofond.ru (к моменту выхода книги представлены частоты 11 основных гаплогрупп в 136 популяциях Западной Евразии).

«ПРОСТЫЕ» КАРТЫ. Были построены 43 карты распространения отдельных гаплогрупп. Можно было построить карты для множества дробных гаплогрупп, но для целей этой книги мы выбрали 43 гаплогруппы, представляющие основное разнообразие митохондриальной ДНК в Евразии.

Перечень картографированных признаков: гаплогруппы А, А4, А5, А* В, С, D, F, Н, J, К, Ml, М3, М7, М7* М7а, М7b, М7Ы, М7b2, М7bЗ, M7b* М7с, Т, Tl, Т2-Т5, Т2, Т* U2, U2* U2a, U2b, U2c, U2e, U4, U5a, U5b, V, W, X, XI, X2, X*,Z.

ОБОБЩЁННЫЕ КАРТЫ. Весь анализ проведён в пределах надёжного пространства, задаваемого картой надёжности (построенной по 278 популяциям при уровне строгости 0.2).

Суммарные карты западноевразийских и восточноевразийских гаплогрупп основаны на картах гаплогрупп H, J, К, Ml, М3, T, Tl, T2-T5, T2, T* U2, U2* U2a, U2b, U2c, U2e, U4, U5a, U5b, V, W, X, XI, X2, X* (западноевразийские гаплогруппы) и A, A4, A5, А*, В, С, D, F, M7, M7* M7a, M7b, M7bl, M7b2, M7b3, M7b*, M7c, Z (восточноевразийские гаплогруппы).

Карты главных компонент изменчивости генофонда построены по картам 20 гаплогрупп А, В, С, D, F, Н, J, К, Ml, М3, М7, Т, U2, U4, U5A, U5B, V, W, X, Z. Набор гаплогрупп сократился только за счет уменьшения их дробности — чтобы гаплогруппы со множеством субгаплогупп (например, многочисленные варианты М7 или U2) не смещали оценки главных компонент.

Карта генетических расстояний суммирует расстояния от средних частот тех же 20 гаплогрупп в русских популяциях.

Наконец, для построения карты гаплотипического разнообразия отдельной гаплогруппы (V) рассчитано разнообразие всех гаплотипов, входящих в гаплогруппу V (дополнение до единицы суммы квадратов частот всех гаплотипов), и полученные значения картографированы. «Карта прародины» получена перемножением карт разнообразия и карты частоты гаплогруппы V.

* * *

Созданные атласы русского генофонда обобщают практически всю информацию об изменчивости русских популяций, накопленную антропологией и генетикой. Восточно-Европейский атлас выявляет взаимодействие русского генофонда с соседями — опять-таки не только по ДНК маркёрам, но и по классическим генетическим маркёрам, а также по антропологическим признакам. А евразийский атлас показывает место русского генофонда в общей системе генофондов Евразии.

Авторы надеются, что эта книга послужит не памятником научным эпохам изучения русского народа по данным антропологии и классическим генным маркёрам, а инструментом при его дальнейшем исследовании в «ДНК-эру». Думается, что ценнейшим преимуществом «ДНК-эры» является её богатое наследство: уникальная возможность объективного сравнения новых результатов с итогами прошлых исследований. Такое сравнение выявляет и новые возможности, и новые промахи молекулярно-генетических исследований, позволяет прокладывать путь не по абрису, а по надёжной геногеографической карте.

6. ТАБЛИЦЫ ЧАСТОТ ГЕНОВ

В этом разделе мы приводим те исходные генетические данные, на которых основано наше изучение русского генофонда. Для русских популяций информация приводится полностью — указаны изученные популяции, частоты генов, объем выборки, литературная ссылка на оригинальную публикацию этой информации, административная принадлежность и географические координаты популяций (таблицы 6.1. — 6.4).

Но изучение русского генофонда проведено не изолированно — в книге мы широко пользуемся данными по другим народам Европы и по другим регионам Евразии. Не имея возможности вместить в книгу всю имеющуюся информацию о популяциях человека, мы приводим усредненные данные по крупным регионам мира, а для Северной Евразии — дополнительно и по ее субрегионам. Для каждого гена в каждом регионе указаны две ключевые характеристики — средняя частота и межпопуляционная изменчивость (таблицы 6.5. и 6.6). Эти сведения являются результатом кропотливого труда, выполненного много лет назад, и мы рады возможности, наконец, представить их широкому, кругу читателей.

Почему мы столь подробно приводим информацию для классических маркеров? Накопление данных по классическим маркерам продолжалось во всем мире несколько десятилетий и в основном завершилось. Подавляющее большинство новых работ посвящено теперь иным — ДНК маркерам. Поэтому важно зафиксировать в таблицах итоги изучения классических маркеров — как в русских популяциях, так и во всем мире (таблицы 6.1. — 6.6. Приложения). Что же касается ДНК маркеров, то по ним объем информации растет как лавина, и сегодняшние сводки данных устареют уже через несколько лет. Тем не менее, мы приводим информацию и по ДНК маркерам — в главе 9 помещена таблица 9.2.1. с частотами гаплогрупп митохондриальной ДНК в основных регионах Евразии, глава 6 завершается таблицей 6.4.1. с частотами гаплогрупп Y хромосомы у народов Европы, а в главе 5 содержится таблица 5.1.1. с частотами аллеля CCR5del32 в русских популяциях. Объем табличных данных по русским фамилиям столь огромен, что мы можем привести лишь частоты 250 «общих» фамилий в шести регионах (глава 7, табл. 7.3.4). Таким образом, мы постарались опубликовать наши исходные данные по возможности полностью, насколько это позволяет объём книги. Исключение составляют лишь соматологические и дерматоглифические данные. Публикация этих сводок является прерогативой их составителей — проф. В. Е. Дерябина и к.и.н. Н. А. Долиновой.

237
{"b":"970748","o":1}