На основе цифровых моделей (а не графических образов) ведется весь точный картографический анализ: анализируются закономерности «простых» карт и строится множество специальных обобщённых карт.
Одну и ту же цифровую модель можно представить в разных графических вариантах, если использовать разные шкалы. При этом получаются различные картографические образы, отвечающие конкретным задачам исследования и особенностям зрительного восприятия. На рис. 10.3.1. (глава 10) в качестве примера показана одна и та же карта (одна и та же ЦМ), представленная в двух разных шкалах. В результате возникли два разных картографических образа. Поэтому при рассмотрении любых карт надо помнить, что непрерывный изменяющийся ряд значений ЦМ при создании графического образа превращён в небольшое число интервалов. И в зависимости от шкалы (границ интервалов) создаются разные графические образы. Это значит, что точное положение изолиний, каких-либо особенностей рельефа на карте не стоит абсолютизировать. Достаточно немного изменить шкалу, и изолиния пройдёт несколько иначе, и особенности очертаний изменятся. Поэтому мы говорим о выявлении резких границ только тогда, когда границы выявляются в самых разных шкалах, или выделяются по двум и более изолиниям.
ТИПЫ ОБОБЩЁННЫХ КАРТ
Важнейшим инструментом нашего исследования являются обобщённые карты. Мы создаём три типа обобщённых карт: карты главных компонент, карты генетических расстояний и карты разнообразия. Каждая из обобщённых карт показывает одну из главных тенденций в генофонде, концентрирует те закономерности, которые в картах отдельных признаков присутствовали только в очень «разбавленном виде».
КАРТЫ ГЛАВНЫХ КОМПОНЕНТ (synthetic maps) — самые популярные обобщённые карты и в отечественных, и в зарубежных геногеографических работах. Анализ главных компонент — это известный статистический метод, который позволяет от множества исходных признаков перейти к нескольким новым, которые называются главными компонентами и являются максимально информативными. При этом первые несколько главных компонент высоко коррелируют с большинством исходных признаков. То есть нам не нужно рассматривать всё множество исходных признаков — достаточно рассмотреть две-три главные компоненты, и при этом мы не потеряем информацию — главные компоненты покажут нам то главное, что есть во всей совокупности исходных признаков.
Две геногеографические школы, возглавляемые Ю. Г. Рычковым и L. L. Cavalli-Sforza, независимо пришли к мысли, что метод главных компонент идеален для выявления основных тенденций в генофондах. Эти два коллектива разработали оригинальные технологии картографирования главных компонент [Menozzi et al., 1978; Рычков, Балановская, 1992]. Точнее, методы расчёта карт главных компонент через карты отдельных признаков.[24]
Карты главных компонент — это карты новых, чрезвычайно информативных признаков. В отечественной традиции принято говорить, что они выявляют основные закономерности генофонда, за рубежом говорят более образно — о сценариях истории генофонда. Для признаков соматологии карты главных компонент заменяются их математическим аналогом — картами канонических переменных. Различие заключается лишь в методике расчёта (см. раздел 4.1.), а для интерпретации карт безразлично, какой показатель использован.
КАРТЫ ГЕНЕТИЧЕСКИХ РАССТОЯНИЙ часто используются в отечественных исследованиях. Странно, что их не изобрели также за рубежом. Ведь в отличие от главных компонент, являющихся математической абстракцией, карты генетических расстояний проще для понимания. Генетические расстояния — интуитивно понятный и очень распространённый инструмент: они показывают величину различий между парой популяций. Чтобы получить карты генетических расстояний, нужно лишь нанести значения генетических расстояний на карту. В каждую точку карты нужно поместить величину расстояния от этой популяции (расположенной в данном месте карты) до одной и той же выбранной нами популяции. Эта популяция, от которой отсчитываются генетические расстояния до всех точек карты, в геногеографии называется «реперной популяцией». Реперную популяцию можно выбрать произвольно: англичане, угличане, смоляне, куряне, пене-ги, печенеги, немцы, ненцы, талыши, латыши, или же, например, «средние показатели Восточной Европы». Карта расстояний покажет, население каких территорий генетически сходно с реперной популяцией, а где генофонд резко отличен от генофонда реперной популяции.
Этот подход может применяться к любым признакам. Но если при анализе генов мы говорим о «генетических расстояниях», то при анализе антропологических данных используются другие формулы расчёта расстояния (степени различий двух популяций). Для геногеографии словосочетания «генетические расстояния», «многомерные расстояния», «обобщённые расстояния» — синонимы. Метод картографирования генетических расстояний описан в Приложении, а также главах 8 и 9.
КАРТЫ РАЗНООБРАЗИЯ — третий тип обобщённых карт — ещё проще и очевиднее. Тем удивительнее, что, хотя показатели генетического разнообразия популяций рассчитываются всеми популяционными генетиками, эти значения наносились на карту обычно лишь в отечественных геногеографических работах. Карты разнообразия показывают уровень генетического разнообразия для каждой точки карты. Есть несколько показателей разнообразия, например — гетерозиготность. Или гаплотипическое разнообразие, карты которого могут быть двух видов: 1) карты общего гаплотипического разнообразия популяции (аналог гете-розиготности для гаплоидных однородительских ДНК маркёров) и 2) карты разнообразия гаплотипов в пределах одной гаплогруппы (показатель возраста гаплогруппы).
Большинство карт разнообразия, рассматриваемых в этой книге, отражают внутрипопуляционное разнообразие. Однако иногда мы создаём и карты межпопуляционной изменчивости. Такие карты полезны как для выявления различий в степени межпопуляционной изменчивости в разных регионах, так и для поиска «генетических границ», то есть зон резких изменений в генофонде (близкий подход использован в работах [Barbujani, Sokal, 1990; Rosser et al., 2000]). Наконец, особым видом карт разнообразия являются карты случайного инбридинга (см. раздел 7.6.).
«КОМБИНИРОВАННЫЕ» КАРТЫ. Кроме карт главных компонент, карт генетических расстояний и карт разнообразия в этой книге использованы и иные карты, представляющие алгебраическую комбинацию нескольких «простых» карт.
Суммарные карты. Эти карты являются суммой отдельных карт, объединяемых по характеру их генетического ландшафта или иным свойствам. При построении таких карт суммируются значения, находящиеся в аналогичных узлах всех исходных карт (карт отдельных признаков). Мы приводим карты суммарной частоты западно-евразийских и восточно-евразийских гаплогрупп мтДНК (разделы 8.2. и 9.2.).
«Карты прародины» (см. раздел 9.2.) являются произведением двух карт: карты частоты гаплогруппы и карты разнообразия той же гаплогруппы. «Карты прародины» показывают, где одновременно высоки и частота, и разнообразие, то есть оконтуривают возможную область прародины гаплогруппы.
Карты генетического риска (раздел 5.2.) рассчитываются по алгебраическим формулам из карт аллелей. Они показывают уровень генетической предрасположенности населения к тем или иным заболеваниям с учетом взаимодействия генов.
В зависимости от задач исследования, можно создавать множество различных комбинированных карт — «алгебраичность» цифровых моделей и разработанное нами программное обеспечение GGMAG и MAPSTAT предоставляют для этого неограниченные возможности.
ЧТО ТАКОЕ АТЛАС
Рабочее название этой книги звучало так: «Атласы русского генофонда». Карты переполняют её, являются тем стержнем, который объединяет анализ всех типов признаков — антропологии, классической генетики, молекулярной генетики, фамилий. Но случайная подборка бесчисленных карт ещё не позволяет ни сравнить разные типы признаков, ни понять генофонд. Для этого нужны картографические атласы.