Литмир - Электронная Библиотека

АНАЛОГОВЫЕ КАРТЫ.

Это заставило нас приступить к созданию нового программного пакета, реализованного программистом А. В. Рычковым [Рычков и др., 1990; Балановская и др., 1990]. В нем был использован принцип интерполяции, моделирующий распространение генов из изученных популяций на все промежуточные области. Эту процедуру мы называли технологией «чернильных пятен». Ее можно представить как «растекание» разноцветных чернильных пятен. На первом шаге — в каждую точку карты, где имеется изученная популяция, наносится такое «пятно», цвет которого соответствует концентрации частоты гена. На следующем шаге

— пятна начинают расплываться во всех направлениях. На каком-то шаге итерации — соседние пятна начинаются смешиваться, реализуя некие промежуточные значения. Чем больше шагов итерационной процедуры — тем сильнее взаимовлияние даже самых отдалённых популяций и тем более «усреднённая» карта возникает перед нами. При этом сохранялась географическая локализация исходных частот генов — благодаря «маскированию» исходного значения частоты в фиксированной точке пространства. Важнейшим достоинством этого метода построения карт было то, что значения частот генов в обследованных географических точках (взаимное расположение которых могло быть сколь угодно нерегулярным) интерполировалось на узлы регулярной сетки. В результате мы получали двумерную цифровую матрицу, с которой можно было проводить любые операции одно- и многомерной статистики. Иными словами, решали нашу сверхзадачу — любая карта могла стать объектом следующего вида анализа. С помощью этого программного пакета были построены различные типы «синтетических» карт — и главных компонент, и генетических расстояний [Балановская и др., 1990] для популяций Центральной Азии и Кавказа.

У этого программного пакета было неоценимое достоинство перед всеми остальными (в том числе, и ныне широко используемыми) технологиями — он создавал как бы аналоговую модель миграции генов. Но все же и он не полностью удовлетворял нашим требованиям. Например, надо было волевым решением выбирать шаг, на котором останавливалась итерация. А основной недостаток заключался в том, что метод не позволял разделить две процедуры — создания карт только на основе исходных данных и «сглаживания» этих карт, то есть устранения случайных флуктуаций для выявления основных паттернов изменчивости. Эти обе процедуры протекали как бы одновременно — в процессе построения карты с числом итераций возрастало и «сглаживание» карты. В результате создавались сразу карты трендов (как и в технологии коллектива L. L. Cavalli-Sforza), а исходная «несглаженная» карта оставалась неизвестной. Этот серьезный недостаток заставил нас искать иные принципы создания карт.

КАРТЫ СРЕДНЕВЗВЕШЕННОЙ ИНТЕРПОЛЯЦИИ

Поэтому в 1990 г. было начато создание третьего варианта программного пакета, который и лег в основу всех последующих компьютерных карт, в том числе и приведённых в данной книге. Он создавался в долгой совместной работе с сотрудниками кафедры картографии МГУ, которыми руководил С. М. Кошель. Пакет использовал известную библиотеку программ MAG; проблемы визуализации цифровых матриц были решены с помощью оригинального пакета «Metacopy», а статистические разделы программы сначала разрабатывались нами совместно с сотрудниками кафедры картографии МГУ (С. М. Кошель, Д. Б. Патрикеев, А. В. Асриев, О. Р. Мусин, В. В. Иванов), а затем

— с помощью своих программистов (И. А. Краснов, В. Е. Папков, Т. П. Папкова, А. В. Рычков, С. Д. Нурбаев и др.).

Путь по созданию программного пакета необходимо было пройти вместе географам и генетикам. Ведь геногеография имеет собственный предмет исследования — пространственную структуру генофонда. При этом генофонд, с одной стороны, является объектом популяционной генетики, другой стороны

— выступает как один из множества объектов тематической картографии [Берлянт, 1986; Трофимов, Панасюк, 1987]. Поэтому компьютерная технология геногеографического анализа генофонда не могла быть просто перенесена из географии, не имеющей дела с генетической информацией. Она создавалась в сотрудничестве с географами, картографами и математиками специально для геногеографического изучения генофонда.

В результате в технологии картографического изучения генофонда максимально учтены и использованы методы картографической науки: методы построения интерполяционных карт, правила оформления карт, принцип анализа фоновых поверхностей. Однако сама технология картографостатистического моделирования и анализа направлена на решение задач популяционной генетики [Балановская и др., 1990; 1994а, б; 1995; 1997 и др.]. Созданный многообразный арсенал средств целиком задан принципами и логикой анализа генофондов. Корреляционный анализ и анализ показателей генетического разнообразия, картографирование главных компонент и размещение популяций в их пространстве, техника «меняющегося» окна и анализ генетических расстояний, оценка, надёжности картографического прогноза и многие другие методы статистического анализа карт разрабатывались специально для задач изучения генофонда.

Совокупность этих методических разработок трудно определить однозначно. В целом они относятся к тематической картографии, по классификации методов — к нескольким разделам математико-картографического моделирования [Берлянт, 1986; Трофимов, Панасюк, 1987]. Наиболее корректно их обозначить как картографо-статистические методы. Их общая цель: дать количественное выражение информации, содержащейся в геногеографической карте; выявить и выразить ту информацию, которая находится в неявном виде (закономерности, тренды, связи и т. д.); провести одно- и многомерный статистический анализ карт для выявления важнейших характеристик генофонда. Вся процедура картографо-статистического анализа генофонда основана на оригинальном программном обеспечении, что позволило создать своего рода компьютерную технологию геногеографического скрининга генофонда.

На основе созданной технологии были построены картографические модели различных параметров не только генофонда, но и целого спектра иных признаков, имеющих отношение к пространственной структуре популяций. Это и характеристики среды — как природные (климатические), так и антропогенные факторы (техногенные нагрузки); и характеристики материальной культуры; и частоты фамилий; и особенности размера популяций и инбридинга; и картографический анализ моногенной патологии [Балановская и др., 1996, 1997, 2000; Грехова и др., 1996; Перепелов и др., 1996; Евсюков и др., 1996, 1997; Петрин и др., 1997; Почешхова, 1998; Почешхова и др., 1998; Spitsyn et al., 1998; Гинтер и др., 1998].

ЗАРУБЕЖНЫЕ ПРОГРАММНЫЕ ПАКЕТЫ

Кроме трех перечисленных отечественных картографических пакетов, существует и ряд иных программ, используемых в зарубежных работах по геногеографии.

Наибольшее значение для геногеографии имел пакет программ, используемых группой L. L. Cavalli-Sforza. Этот пакет позволяет проводить как картографирование отдельного гена, так и расчёт синтетических карт главных компонент, хотя и не предусматривает другие виды статистического анализа и трансформации карт. Похожие, хотя и ещё менее мощные программы разрабатывались и некоторыми другими коллективами популяционных генетиков [например, Sokal, 1999а, б].

А в последние годы определенную популярность приобрела программа Surfer (Golden Software Surfer 7.0). Этот картографический пакет не является геногеографическим, а предназначен для картографирования любых, в первую очередь климатических параметров. Но он позволяет быстро построить интерполяционные карты любых признаков — в том числе и распространения генов, и поэтому нередко используется в современных работах для картографирования распространения гаплогрупп митохондриальной ДНК и Y хромосомы [Semino et al., 2000; Rootsi et al., 2004]. Но у программы Surfer есть очень крупный недостаток, отличающий её от остальных картографических программ, используемых в геногеографии. Это отличие состоит в том, что карты, построенные Surfer, являются только изображениями. Программа нацелена только на графический результат, а не на создание цифровой модели карты. То есть для каждой точки карты нельзя получить точные численные значения признака, а значит, нельзя проводить никакие виды картографо-статистического анализа, нельзя рассчитать карты главных компонент и так далее. Программа Surfer, таким образом, оказывается весьма эффективной для иллюстрации, для изображения распространённости отдельных признаков, но не позволяет проводить статистический анализ карт и строить все множество производных карт, в том числе синтетических. Иными словами, она позволяет картографировать распространённость отдельных генов, но не позволяет изучать генофонд.

201
{"b":"970748","o":1}