Литмир - Электронная Библиотека

ТРЕБОВАНИЕ ВТОРОЕ: ПОЛИМОРФИЗМ ГЕНЕТИЧЕСКИХ МАРКЕРОВ

Это требование налагает запрет на включение в анализ редких аллелей.

Надёжность эмпирических оценок FST(i) зависит от уровня полиморфизма изучаемых генов. Эта важно учитывать при оценке селективных сил, поскольку при низком уровне полиморфизма (то есть если частота аллеля близка к 0 или 1) динамика частот генов «будет независима не только от далекого прошлого, но, возможно, и от недавней истории процесса отбора» [Левонтин, 1978].

Традиционно предлагаются два критерия полиморфизма: 1 % (то есть 0.01≤q≤0.99) и 5 % (0.05≤q≤0.95). Иногда — например, при исследовании гетерозиготности Н — вводятся и более жесткие рамки: Н>0.02, что соответствует 0.14≤q≤0.86. Необходимость введения критерия полиморфизма при анализе FST-статистик убедительно показана при компьютерном моделировании FST(i) при разных значениях генных частот (i) (рис. 4.3., приводится по [Bowcock et al., 1991]). Из графика видно, что при средней частоте гена в тотальной популяции q<0.05 оценки межпопуляционной изменчивости FST(i) варьируют случайным образом в чрезвычайно широком диапазоне. Они выходят на плато при q≈0.05 и практически неизменны при q>0.10. Вспомним, что для достоверного определения FST(i) и q при малых концентрациях гена необходимы ещё и огромные популяционные выборки: чем меньше частота аллеля, тем больше должна быть выборка для того, чтобы эта частота достоверно отличалась от нуля. Из этого становится ясно, как важно следовать критерию полиморфизма, и сколь высока возможность ошибки при включении генов с низким уровнем полиморфизма (редких аллелей).

Русский генофонд на Русской равнине - img_256

Рис. 4.3. Компьютерное моделирование ожидаемых оценок межпопуляционного разнообразия FST в отсутствие отбора.

По оси абсцисс — частота гена q; по оси ординат — FST; % — вероятность значений FST (квантили) по [Bowcock et al., 1991].

Насколько велика может быть эта ошибка, видно, например, из двух опубликованных оценок дифференциации коренного населения Австралии по гену FY*B: 1) FST(i)=0 при q=0.00 [Балановская, Рычков, 1990]; 2) FST(i)=8.5 при q=0.01 [Cavalli-Sforza, Piazza, 1993]. Величина FST(i)=8.5 очень велика — она составляет половину изменчивости человечества (FST=14.5, табл. 4.3). Насколько можно судить по приведенным данным, во второй работе в выборку попали метисы коренных австралийцев с европейцами (у которых частота этого гена существенна) — такой случайности достаточно, чтобы на порядок изменить не реальную дифференциацию коренных австралийских популяций, а получаемую оценку дифференциации низко полиморфного гена.

Итак, включение в выборку низко полиморфных генов приводит к неустойчивости (непредсказуемости оценок дифференциации генофонда FST, а также к отклонению от изменчивости по селективно-нейтральному типу (то есть FST≈Fe).

Именно поэтому для получения устойчивых оценок дифференциации генофонда FST желательно использовать выборки генов, соответствующию строгому критерию полиморфизма: 0.05≤q≤0.95. Это важно ещё и потому, что для слабо полиморфных генов велика не только случайная ошибка. На её фоне проявляется и систематическая ошибка: включение слабо полиморфных генов вызывает занижение средней оценки дифференциации FST.

Поясним этот момент. На рис. 4.4. представлены оценки для шести основных регионов мира из сводки [Cavalli-Sforza et al.,

1994]. Мы рассчитали их в двух вариантах: 1) по всем маркёрам (0<q<l, левый столбик); 2) с учетом критерия полиморфизма (0.05<q<0.95, правый столбик). Мы видим, что для всех регионов пренебрежение критерием полиморфизма привело к занижению изменчивости генофонда. Лишь в Европе различия между обеими оценками невелики — видимо оттого, что именно европейские ученые и выбирали панель классических маркёров для популяционных исследований: в Европе они большей частью полиморфны.

Итак, рассмотрение разных оценок изменчивости генофондов основных регионов мира выявило, что устойчивость оценок FST связана с тремя факторами: 1) долей низко полиморфных генов; 2) средним уровнем их полиморфизма; 3) организацией данных о генофонде. Существует ещё один фактор — использование маркёров одного или же разных типов. Чтобы учесть его, необходимо выполнить ещё одно требование к организации исходных данных.

ТРЕБОВАНИЕ ТРЕТЬЕ: РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ ГЕННЫХ МАРКЕРОВ

Это требование означает, что нельзя включать в анализ маркёры одного лишь типа — это может привести к смещению полученных оценок изменчивости.

Структура генофонда отражена в результатах его изучения с той или иной точностью. Но, как положено в естественных науках, два корректных исследования одного и того же параметра для одного и того же генофонда должны привести к одинаковым выводам. Конечно же, число генов, по изменчивости которых делается вывод об изменчивости всего генофонда, должно быть достаточно велико, но оно всегда намного меньше общего числа генов в геноме (и, соответственно, в генофонде). Поэтому обобщённая изменчивость в разных исследованиях может определяться по совершенно разным, не перекрывающимся множествам генов, но результаты этих исследований все равно должны совпасть.

Это и понятно, поскольку целью этих работ является не изучение изменчивости данного набора генов, а исследование закономерностей генофонда. И если сравнивается изменчивость двух разных типов генов в одном и том же ареале, то ожидаемым и естественным должно быть совпадение результатов. Если же результаты несходны, то это тревожный знак того, что, по крайней мере, одна из систем не дает оценку «обобщённого гена», по крайней мере, один из результатов неверен. Неверен в том смысле, что он не отражает общую структуру генофонда, хотя возможно, вполне удовлетворительно описывает изменчивость данного набора генов.

Это снова подводит нас к вопросу о том, сколько и каких конкретных генов надо включить в анализ, чтобы их совокупная изменчивость соответствовала изменчивости некоего «обобщённого гена», отражала изменчивость не конкретного набора генов, а генофонда в целом. Но прежде ещё раз подчеркнём, что характеристику генофонда можно получить по разным панелям генетических маркёров, и все эти оценки могут быть правильными и равноценными и, что наиболее существенно, они должны совпадать друг с другом.

Формулируя требования к репрезентативности выборки генов — по отношению ко всему геному — важно учитывать обе её стороны, количественную и качественную.

1) КОЛИЧЕСТВЕННЫЙ АСПЕКТ ФОРМИРОВАНИЯ ВЫБОРКИ — ЧИСЛО ГЕННЫХ МАРКЁРОВ В ДАННОЙ ПАНЕЛИ.

Разные авторы пришли к эмпирическому обобщению, что, как правило, выборка примерно из 20–30 локусов (или ≈50 аллелей) является достаточной для надёжной оценки FST. При дальнейшем увеличении выборки средняя оценка FST практически не меняется [Bowcock et al., 1987; Айала, Кайгер, 1988; Cavalli-Sforza, Piazza, 1993]. Меньшая выборка генов тоже может давать корректные результаты, но необходима проверка её корректности. Меньшая выборка требует обязательного контроля её репрезентативности с помощью прямых оценок Fe (§ 2) или иных доказательств её адекватности и соблюдения равенства FST=Fe.

Русский генофонд на Русской равнине - img_257

Рис. 4.4. Оценки селективно-нейтральной дифференциации генофондов FST≈Fe для основных генофондов коренного населения ойкумены

223
{"b":"970748","o":1}