Читать "Русский генофонд на Русской равнине" - Балановская Елена Владимировна (?) - Страница 196

Вход

Войти на сайт

Я забыл пароль
Регистрация

Регистрация

Литмир - Электронная Библиотека > Балановская Елена Владимировна (?) > Русский генофонд на Русской равнине > Стр.196

Содержание

Сохранить

Эти меры подробно описаны во многих зарубежных руководствах по популяционной генетике. Из отечественных и переведенных монографий можно рекомендовать учебники [Ли, 1978; Вейр, 1995] В русскоязычных монографиях основные сведения о F_ST и С_SТ-статистиках кратко, но очень емко освещены в работах Ю. П. Алтухова [Алтухов, 1983, 1989, 2003; Алтухов и др., 1997; Динамика популяционных генофондов…, 2004]. Оба показателя (F_ST≈G_ST) являются нормированной дисперсией частоты аллеля.

Например, F_ST=σ²_q/q(1-q), где σ²_q=k^-1∑(q_j- q)², а средняя частота аллеля q в подразделённой популяции, состоящей из k субпопуляций (j=1,2…, k), рассчитывается как k^-1∑q_j.

Неевская мера генетического разнообразия (G_SТ-статистика) имеет на наш взгляд, некоторые преимущества перед другими: она концептуально проста и логична; её посылки и преобразования имеют ясный и точный биологический смысл, теория её элегантна, расчёты не громоздки. G_SТ-статистика может быть выражена и в понятиях F_ST, блестяще разработанных теорией популяционной генетики, и в привычных ныне многим понятиям генетических расстояний (как угловых, так и неевских), а поэтому G_SТ-статистика позволяет использовать модели и результаты, изложенных в терминах всех этих мер. Также крайне важно, что G_SТ-статистика может успешно применяться для популяций, в которых нарушено равновесие Харди-Вайнберга, нет случайного скрещивания и действует естественный отбор [Nei, Roychoudhury, 1974; Nei, 1975].

АНАЛИЗ ИЕРАХИЧЕСКИХ (МНОГОУРОВНЕВЫХ) ПОПУЛЯЦИЙ

Очень важное достоинство G_SТ-статистик — возможность вести анализ иерархически соподчиненных популяций. Для этого разработан четкий алгоритм, позволяющий разложить генетическую изменчивость популяций огромного региона G_SТ на её составляющие. Поясним этот механизм на примерах (детальное описание алгоритма и результатов его использования дано в [Рычков, Ящук (Балановская), 1980, 1983, 1986]). Каждый иерархический уровень популяций, начиная с самых «дробных» популяций и поднимаясь до уровня региона, обозначим цифрами 1, 2, 3 и т. д. Пусть первый уровень (1) — локальные популяции (села, веси, города). Второй уровень (2) — территориальные группы народа (например, казаки или поморы в пределах русского народа). Третий уровень (3) — этносы (то есть народы — например, русские, белорусы и украинцы). Четвертый уровень (4) — группы «родственных» народов (например, лингвистические ветви — славянская, романская). Пятый уровень (5) — население, говорящее на языках одной лингвистической семьи (индоевропейской или же уральской). И последний, верхний уровень (Т) — «тотально» население всего региона (например, Восточной Европы).

С помощью G_ST-статистик мы можем оценить среднюю генетическую изменчивость популяций на каждом уровне популяционной системы. Тогда G₁₂ — обозначает средние генетические различия между локальными популяциями в пределах одной территориальной группы (например, между популяциями поморов); G₂₃ — средние различия между территориальными группами в пределах одного народа (например, поморы, казаки и другие — в пределах русского народа); G₃₄ — средние генетические различия между народами в пределах лингвистической ветви; G₄₅ — средние различия между ветвями одной лингвистической семьи; G_5T — различия между лингвистическими семьями региона. При этом соблюдается равенство G_ST=G₁₂+G₂₃+G₃₄+G₄₅+G_ST.

Все составляющие G_ST связаны аддитивно. Поэтому, если мы решим «миновать» какие-то уровни, это не создаст проблем. Например, у нас не для всех этносов региона есть генетические данные об их территориальных группах (удмурты и карелы представлены лишь одной группой популяций). Или нет сведений о генофондах разных ветвей лингвистической семьи (индоевропейская семья представлена только славянами). В этих случаях мы можем плохо представленные уровни просто «пропустить». Тогда у нас будет G₁₃ — средние генетические различия между локальными популяциями в пределах одного народа (например, села и веси в пределах русского народа, минуя территориальные группы); G₃₅ — средние генетические различия между народами в пределах лингвистической семьи (минуя лингвистические ветви); G_{ST —}различия между лингвистическими семьями региона (здесь мы на самом деле миновали «суперсемьи», например, ностратическую). При этом будет соблюдаться равенство G_ST=G₂₃+G₃₅+G_ST.

ДВЕ СОСТАВЛЯЮЩИЕ ИЗМЕНЧИВОСТИ; МЕЖДУ ПОПУЛЯЦИЯМИ И ВНУТРИ ПОПУЛЯЦИЙ

В понятие G_SТ-статистик входят не только сами G_ST и их составляющие (G₁₂, G₂₃, G₁₃…), которые оценивают различия между популяциями, но также Н_T и Н_S, обращенные «внутрь» популяций. Показатель Н_T оценивает общее генетическое разнообразие, накопленное всей «тотальной» популяцией. Он включает в себя и различия между популяциями G_ST, и различия между индивидами внутри популяций Н_S. Показатель Н_S оценивает различия внутри популяции и потому называется показателем гетерозиготности популяции. Это и понятно — показатель Н_S оценивает, насколько генетически похожи друг на друга представители одной популяции. Н_S может оцениваться для любого уровня иерархии, но обычно рассчитывается только для самого нижнего уровня, каким бы мы его ни выбрали — то есть это может быть гетерозиготность локальных популяций или же этносов. Все G_SТ-статистики связаны между собой следующими соотношениями:

G_SТ≈F_ST=D_ST/H_T

H_T=D_ST+H_S

H_T=1-∑q²_i

H_S=1-∑q²_ij

где q_ij — частота i-того аллеля в j-той субпопуляции (j=1,2…, k), k — число субпопуляций; — средняя частота i-того аллеля в тотальной популяции, а D_SТ=(k-1)^-1(q_i-q_ij)² представляет собой дисперсию частоты аллеля.

D_ST, F_ST и G_ST — ЭТО ПО СУТИ ПОЧТИ ОДНО И ТО ЖЕ

Однако сама дисперсия D_ST зависит от частоты аллеля в популяции. Поэтому всегда используют показатель G_ST. Он, как и F_ST, представляет собой дисперсию частот аллелей, нормированную на общее генетическое разнообразие Ну, и не зависит от средней частоты аллеля. Для диаллельных генов равенство G_ST=F_ST выполняется строго, для мультиаллельных генов равенство выполняется лишь примерно: G_ST≈F_ST, поскольку в расчёт F_ST входит и оценка ковариации между частотами аллелей, а для G_ST — не входит. Но это не мешает обоим этим показателям быть очень близкими по величине и взаимозаменяемыми: ведь размах ковариации между частотами аллелей обычно меньше той случайной ошибки, с которой и F_ST, и G_ST варьируют около истинной оценки различий между популяциями. Поэтому вся огромная литература о статистических свойствах F_ST распространяется и на свойства G_ST. И мы дальше используем G_ST и F_ST как синонимы, хотя сами величины межпопуляционных различий оценивали с помощью неевских G_ST статистик.

196

Перейти к описанию Предыдущая страница Следующая страница

Войти на сайт

Регистрация