4. Визуализация карты (создание графического изображения по данным цифровой модели).
5. Преобразование отдельной карты (например, дополнение до единицы).
6. Преобразование совокупности карт (например, суммирование карт).
7. Построение трендовой карты (усреднение значений попавших в плывущее окно).
8. Построение трендовой карты с использованием многочленов Чебышева.
9. Построение карты межпопуляционной изменчивости или другого показателя, рассчитываемого по заданной формуле в плывущем окне постоянного или меняющегося размера.
10. Расчёт корреляции карты с географическими координатами.
11. Построение корреляционной карты.
12. Построение синтетических карт (главных компонент, гетерозиготности, генетических расстояний) по нескольким исходным картам.
Напомним ещё раз, что к любым картам могут применяться любые из этих операций — например, можно построить трендовую карту не только для простой, но и для обобщённой карты, рассчитать корреляцию корреляционной карты с географическими координатами и так далее.
3. КАРТОГРАФИЧЕСКАЯ ТЕХНОЛОГИЯ
«Его Величество дал миру карты… Блага, принесённые императором Карлом, распространяются на всю вселенную, даже на земли, еще не открытые». Мартин Кортес де Алькабар, испанский королевский картограф, «Breve compendio de la sphera у de la arte de navegar, con nuevos instruments у reglas, exemplificado com muy subtiles demostraciones», 1530 г.
В этом разделе важнейшие из методов, упомянутых при рассказе о картографическом арсенале, описаны подробнее, с указанием конкретных алгоритмов и особенностей расчёта. Но сначала мы кратко расскажем об истории разработки этих методов (§ 1), а в заключение (§ 9) рассмотрим особый аспект анализа главных компонент — так называемую проблему ложных корреляций.
§ 1. Как карты пришли в геногеографию
КАРТЫ И ГЕНОГЕОГРАФИЯ
Более полувека, прошедшего с момента зарождения геногеографической идеи до её современного воплощения, — срок достаточно большой, чтобы раскрылись те её стороны, которые первоначально оставались в тени, и принципиальная важность которых в начале не была определена. Мы имеем в виду карту как инструмент геногеографического исследования. Перефразируя утверждение академика Д. Н. Анучина, можно сказать, что степень геногеографического познания генофонда страны определяется степенью совершенства имеющейся для него карты. Современная геногеография уже немыслима без компьютерной картографии как её основы. Картографический анализ не только обеспечивает создание математически строгих, объективных и унифицированных карт, но и создаёт совершенно новые возможности для анализа явлений, моделируемых геногеографическими картами. По мысли А. С. Серебровского, геногеография способна обнаруживать главнейшие процессы, происходящие в генофонде. И лучше всего она это делает с помощью карт. На современном этапе развития геногеография имеет многообразный картографический инструментарий для корректного решения сложных задач. Именно картографическое исследование географической архитектоники генофонда позволяет анализировать географию и историю процессов, формирующих основные свойства генофонда.
Вся сложность ситуации заключалась в том, что вопрос о карте как инструменте геногеографии не был поставлен А. С. Серебровским, создававшим науку геногеографию. Именно поэтому в дальнейшем на долгое время возобладал чисто статистический анализ популяций, изъятых из географического пространства. Карты географического распространения генов, особенно генов и фенотипов человека, создавались, а чаще — рисовались и до, и после постановки А. С. Серебровским проблем геногеографии. Некоторые прекрасные работы, основанные на строгом картографическом методе, остались малоизвестны и незаслуженно забыты [Чепурковский, 1913]. Другие, представляющие результат иллюстрирования, а не картографического анализа распределения генов, широко известны [Mourant et al., 1976].
КОМПЬЮТЕРНОЕ КАРТОГРАФИРОВАНИЕ
Лишь с 70х годов XX века начал формироваться картографический подход к геногеографии — как на путях создания цифровых моделей карт, так и на путях математического анализа и точного отображения трендовых явлений на карте [Cavalli-Sforza, Bodmer, 1971; Ward, Neel, 1976; Rychkov, Sheremetyeva, 1977, 1979]. На рубеже 80х годов, благодаря органическому соединению с картографией и с созданием компьютерных банков данных о частотах генов в населении, начался принципиально новый этап в развитии геногеографии — компьютерное генетическое картографирование [Menozzi et al., 1978; Piazza et al., 1981a, 19816, Ammerman, Cavalli-Sforza,1984]. Геногеография популяций человека пережила и в переносном, и в буквальном смысле второе рождение: возник журнал Gene Geography (1987 г.). Как ни печально, его учредители не догадывались ни о происхождении и долгой предыстории геногеографии, ни о её связи с исследованием генофонда, и полагали, что созданием журнала оформили те идеи, что витали в европейской науке в 60 х годах нашего столетия [Terrenato, личное сообщение]. Возможно, именно поэтому журнал был ориентирован исключительно на публикацию данных о частотах генов в населении мира, оставляя за рамками своих публикаций проблемы не только генофонда, но и генетической картографии.
Как бы то ни было, началась эпоха компьютерной геногеографии и создания электронных карт географического распределения генетической информации. Это означает, что появилась практическая возможность от географии генов человека перейти к географии генофондов населения мира, регионов, отдельных стран и этнических групп. Появилась возможность исследовать генофонд не только общими генетико-статистическими методами, но и собственными уникальными методами геногеографии — картографическими.
Широкие возможности компьютерных карт и заставили нас взяться за их создание. При этом мы прошли долгий путь, причём полностью независимо от коллектива L. L. Cavalli-Sforza. Их «синтетические» карты мы увидели тогда, когда уже были созданы наши «обобщённые» карты. Тем более впечатляюще и закономерно, что оба коллектива независимо шли параллельными путями. Эти пути ни в чем не повторяли друг друга, однако при этом все общие инструменты картографирования оказались очень похожи. Поэтому мы не будем в этой книге останавливаться на анализе сходства и различий в технологиях — достаточно того, что получаемые карты обоих коллективов полностью сопоставимы.
ТРИАНГУЛЯЦИОННЫЕ КАРТЫ
На рубеже 80х годов — ещё до эпохи персональных компьютеров — один из авторов этой книги вместе с профессором Ю. Г. Рычковым и известными специалистами в области математического моделирования А. Т. Терехиным и Е. В. Будиловой начали разрабатывать первый вариант программного обеспечения для компьютерного картографирования. К сожалению, этот вариант так и не был опубликован. В его основе лежала триангуляционная процедура, использующая метод ближайшего соседа. Она позволяла строить и в целом корректные карты частот отдельных генов, и «обобщённые» карты — главных компонент изменчивости генофонда в целом. Иными словами, этот вариант программного обеспечения позволял создавать все те карты, которые примерно в это же время независимо разрабатывал коллектив под руководством L. L. Cavalli-Sforza [Menozzi et al., 1978; Piazza et al., 1981а]. Однако триангуляционная процедура построения карт приводила к трудно устранимому недостатку — на границах ареала значения признака были неустойчивыми. Были ещё несколько особенностей этой процедуры. Основную проблему составляло то, что такую карту было сложно «накрыть» равномерной сеткой и создать полностью сравнимые числовые матрицы разных карт. Эти особенности не позволяли решить сверхзадачу — сделать любую карту не только результатом, но и объектом следующего вида анализа.