Подводя итог этого направления исследований, можно сказать, что они показали, каков приток «в фамилию» генов из других фамилий (первая работа такого рода осуществлена в 1973 году [Genest, 1973], но основной ряд работ выполнен только в последние пять лет) и какова непосредственная связь между фамилией и гаплотипом Y хромосомы.
«Пофамильное» направление представляет большой интерес и для частных лиц, интересующихся своей родословной. Можно только порадоваться за знаменитого профессора Bryan Sykes и за Brian McEvoy, которые смогли совместить интереснейшую для науки работу с удовлетворением собственного любопытства по поводу происхождения своей фамилии.
ПОПУЛЯЦИОННАЯ СВЯЗЬ ФАМИЛИИ И ГЕНОТИПА
Это второе направление исследований, изучающих сопряженность фамилии и Y хромосомы. Оно нацелено на анализ генетических различий между популяциями, различающихся по происхождению фамилий.
Здесь фамилия выступает не как квазигенетический маркёр конкретной Y хромосомы, а как квазигенетический маркёр популяции. В этом случае оказывается не важно, насколько велика связь конкретной фамилии с конкретной Y хромосомой: фамилия как признак культуры становится в один ряд с другими квазигенетическими маркёрами или характеристиками популяции — лингвистическими, этнографическими и прочими. Также как, например, наличие определённого узора на традиционной одежде или же наличие сходных мотивов в мифах, так и сходство популяций по большому числу фамилий может указывать на возможную близость популяций. При популяционном подходе отдельные случаи «не-отцовства» не отражаются на популяционных частотах фамилий, поскольку эти случаи редки и в целом компенсируют друг друга.
Во всех работах подчёркивается, что огромным преимуществом фамилий по сравнению с другими квазигенетическими маркёрами является возможность тотального исследования населения.
В работе Zei и соавторов [Zei et al., 2003] исследуется население Сардинии. Выборка подразделяется по месту происхождения коренных сардинских фамилий, которое определяется по области Сардинии с максимальными частотами данной фамилии, а также по историческим источникам. Фамилии отнесены к трём историко-географическим зонам Сардинии. Показаны генетические различия между популяциями, фамилии которых принадлежат разным регионам.
В работе Immel и соавторов [Immel et al., 2006] две сравниваемые группы формируются из одной выборки — жителей г. Галле (Германия). Выборка разделена по происхождению фамилий обследуемых: у 195 мужчин фамилии немецкого (группа G); у 185 — фамилии славянского происхождения (группа S); у 39 человек фамилии смешанного происхождения (группа М). В качестве сравниваемых групп использовались данные о 29 сорбах (коренное славянское этническое меньшинство, проживающее на границе с Польшей) и о 1313 поляках из [Roewer et al., 2005]. Была показана генетическая близость группы (S) с поляками и сорбами и значительно большее генетическое расстояние от этих трёх групп до смешанной группы, включающей генетически не различающиеся выборки (G) и (М).
Наиболее любопытной нам кажется работа Bedoya с соавторами [Bedoya et al., 2006], поскольку она сочетает в себе подходы популяционных и «пофамильных» исследований. В работе привлекаются данные о динамике частот фамилий за несколько последних веков, чтобы определить характер изменения популяционной структуры в этот период. Работа посвящена горному изо-ляту в Колумбии, основным фактором популяционной динамики которого была иммиграция испанцев, действовавшая с той или иной интенсивностью после их первого появления на территории Колумбии. Сходство распределений фамилий в конце XVIII века и в наше время при возрастании с тех пор численности населения в 107 раз позволяет авторам утверждать, что, по крайней мере, с конца XVIII века основным фактором динамики популяций был её рост, а не иммиграция из Европы. Этот вывод чрезвычайно важен для интерпретации результатов молекулярно-генетического анализа, проводимого авторами, и уточнения времени формирования наблюдаемых особенностей популяционного генофонда.
Аналогичная работа была проведена ранее нами [Почешхова, 1998; Балановская и др., 1999; Балановская и др., 2000] по изучению фамилий древнейшего коренного населения Западного Кавказа — адыгейцев и шапсугов. В работе, охватывающей тотально всех шапсугов, прослежена динамика их фамилий (населявших ранее побережье Черного моря от Туапсе до Сочи) на протяжении шести поколений. Такое глубокое знание генеалогии позволило сделать шесть «временных срезов» фамильного состава популяций, то есть реконструировать генофонд населения на одно, два, три, четыре, пять и шесть поколений назад. В результате такой реконструкции показана высочайшая устойчивость популяции: благодаря сохранению брачных традиций, она сохранила популяционную структуру вопреки переселениям и катастрофическому сокращению численности популяции в результате Кавказской войны (середина XIX века). Удивительное сходство всех шести карт главных компонент фамилий, построенных по данным о шести поколениях, и даёт нам право говорить о преемственности генофонда во времени, о сохранении его структуры даже после такой демографической катастрофы, которую претерпели шапсуги. Это означает, что с помощью фамилий мы можем проникать вглубь поколений, реконструировать генофонды прошедших времен.
КОРРЕЛЯЦИЯ РУССКИХ ФАМИЛИЙ И ГАПЛОГРУПП Y ХРОМОСОМЫ
Рассмотрев вкратце, каковы мировые данные о связи фамилий и Y хромосомы, обратимся к изучению этой связи в русском генофонде.
Конечно, мы понимаем, что даже если мы проведём (как в случае наших русских регионов) полностью параллельный анализ одних и тех же популяций и по фамилиям, и по Y хромосоме, то всё равно полного совпадения результатов быть не может. Маркёры Y хромосомы — это «настоящие» гены, но у них есть свой изъян: по ним изучено много меньшее число популяций и человек. По Y хромосоме 1257 человек представляют 14 районов. По фамилиям изучен миллион человек из 50 районов. Разница существенная. Но у фамилий, к сожалению, есть свой и куда более важный недостаток — они только «квазигены», столь переменчивые и столь юные по сравнению с настоящими генами.
Поэтому нельзя ожидать полного сходства. Но есть ли оно вообще?
Те, кто заглядывал в 6 главу, уже знают, что сходство налицо. Напомним, что на карте главного сценария всех гаплогрупп Y хромосомы, мы видели чётко выраженный широтный градиент (рис. 6.3.11.). Это означает, что, двигаясь с севера на юг, мы обнаруживаем намного большие различия между русскими популяциями, чем двигаясь с запада на восток. Мы видим на этой «главной» карте Y хромосомы и резкие различия Северного и Южного регионов, и сходство регионов средней полосы. Это значит, что по маркёрам Y хромосомы в главе 6 мы видели ту же картину структуры русского генофонда, которую только что прогнозировали по фамилиям. Гены и фамилии в этой общей картине русского генофонда согласны друг с другом.
Но можно возразить, что это сходство отражает лишь самые общие черты генофонда, и получено оно с помощью качественных, а не количественных сравнений. Хотя мы считаем, что совпадение общих черт генофонда намного важнее количественного анализа, но проведём и его. Причём максимально строго. Выше мы рассчитали матрицу неевских генетических расстояний между пятью русскими регионами по данным о фамилиях. Проведём полностью аналогичный расчёт расстояний и для маркёров Y хромосомы. И построим матрицу тех же неевских генетических расстояний между теми же пятью основными регионами, но теперь уже по данным об изменчивости Y хромосомы.
Чтобы анализ был полностью количественным, мы будем сравнивать друг с другом не диаграммы многомерного шкалирования, являющиеся «картинками», иллюстрациями этих расстояний, а сами матрицы расстояний.
Коэффициент связи оценивает, насколько фамилии и гены дают похожие оценки близости между регионами, то есть оценки структуры русского генофонда. Если сходство велико, то коэффициент корреляции будет большим (при полной идентичности равен 1). Если сходства нет, то коэффициент корреляции будет равен 0.