СЕМАНТИЧЕСКИЕ КЛАССЫ
Фамилию можно отнести к одному из пяти классов.
1. «Календарные» — образованные от имён церковного календаря (например, Иванов, Феофанов).
2. «Профессиональные» — от названий профессий (Кузнецов, Колесников).
3. «Звериные» — от слов, описывающих животный и растительный мир (Волков, Жуков, Дубов, Листьев).
4. «Приметные» — от примет внешнего или психологического облика (Румянцев, Быстров).
5. Фамилии, которые нельзя отнести ни к одному из этих классов (Морозов, Булыгин) выделяются в пятый класс «иные».
Распределить фамилии даже по таким примитивным классам непросто. Не зная устаревших, диалектных или просто редких слов («бондарь» — делающий бочки, «саук» — Савва, «третьяк» — третий ребенок в семье) можно неправильно классифицировать Бондаренко, Саукова, Третьякова. А для многих фамилий этимология неоднозначна, запутанна и спорна. Так что классифицировать фамилии должен бы специалист по русской ономастике, но из-за неудач в поисках такового авторы решились классифицировать пока сами.
Результаты, как часто бывает с анализом фамилий, превзошли ожидания.
ФАМИЛЬНЫЕ ПРОФИЛИ РЕГИОНОВ
Рассмотрев пятьдесят фамилий, самых частых в Центральном регионе «топ-50», мы обнаружили, что из них 25 — «звериные». То есть 50 % фамилий приходится именно на один этот класс. В Западном регионе на один класс приходится ещё больше — 60 % фамилий, но этот лидирующий класс включил вовсе не «звериные», а календарные фамилии. На Северо-Западе календарные фамилии совсем вытесняют остальные — там их 82 %. А в Восточном регионе календарных только 14 %, но зато как нигде часты приметные фамилии, которые делят первое место со «звериными» фамилиями. Так получилось, что каждый из остальных двух классов фамилий тоже имеет «свой» регион: профессиональные фамилии лидируют на юге (там их 34 %), а «иные» — на севере (тоже 34 %).
Так что мнение о том, что самые русские фамилии — это Иванов, Петров и Сидоров (то есть календарные), справедливо только в западной части «исконного» ареала, и совсем неверно для востока и центра. Создаётся впечатление, что регионы различаются по способам образования фамилий — на юге чаще всего от профессий, в центре — «от зверей» и так далее. И каждый регион имеет свой характерный «фамильный профиль» — сколько фамилий приходится на долю каждого класса.
Это не просто любопытное открытие, но и инструмент изучения генофонда. Посмотрим, например, на кубанских казаков. Их предки пришли из России и Украины, но откуда именно из России? Это вопрос о генофонде, и семантические классы фамилий могут дать предварительный ответ. Профиль фамилий кубанских казаков таков:
Календарные — 34%
Профессиональные — 22%
Звериные — 16%
Приметные — 14%
Иные — 14 %.
Этот профиль больше всего похож на профиль соседнего с казаками Южного региона. Но фамилии показывают, что предки казаков переселялись не только оттуда. Отличия «казачьего» профиля от «южного» свидетельствуют, во-первых, о значительном потоке фамилий из среднерусских регионов, и, во-вторых, о последующей самостоятельной жизни казачьей популяции и о возникновении собственных неповторимых фамилий. Конечно, не стоит думать, что беглый анализ всего лишь по пяти классам фамилий явится откровением о происхождении кубанских казаков. Но это иллюстрация тех реальных возможностей, которые даёт семантический анализ фамилий.
Ещё пример: как мы помним, статистический анализ показал, что фамильный фонд Сибири близок к среднерусскому — вероятно, по причине миграций из разных русских регионов. Семантический анализ добавляет, что особенно мощными могли быть миграции из самого географически отдалённого региона — с Запада: именно с «западным» профилем особенно схож «сибирский».
ПЕРЕЧИСЛИМ МЕТОДЫ
Для анализа фамилий мы применили не один-два, а веер практически независимых методов. Упорядочим их.
1) «ТОПЫ»: АНАЛИЗ САМЫХ ЧАСТЫХ ФАМИЛИЙ. В самых разных видах анализа нужно «перебрать» все фамилии — то сравнить их, то классифицировать, а сделать это вручную для многотысячных списков невозможно. Поэтому мы часто брали в анализ лишь несколько самых частых фамилий. Например, только что описанный анализ семантических классов выполнен по «топ-50»: в каждом регионе взяты 50 фамилий, самых частых в этом регионе, и только они классифицированы по семантике. Кроме «топ-50», использованы «топ-20», и даже «топ-10» и «топ-5» (только 5 самых частых фамилий). Несколько проверок показали что результаты, полученные по топ-50 и топ-20, обычно хорошо согласуются с анализом всего массива фамилий. Это значит, что использование только «топов» для многих видов анализа правомочно… Хотя, конечно, никогда заранее неизвестно, насколько большим должен быть «топ» чтобы дать правильный результат.
2) ПОИСК «ВСЕОБЩИХ» ФАМИЛИЙ. Раз мы имеем полные списки фамилий, встреченных в каждом регионе, мы можем посмотреть, насколько они перекрываются. Точнее: есть ли такие фамилии, которые встречаются в каждом регионе, существуют ли общерусские, повсеместные, «всеобщие» фамилии? При сравнении пяти регионов нашлось 257 таких фамилий. И есть основания думать, что после изучения других регионов этот список не сильно изменится — к нашему изумлению, при включении в анализ Сибирского региона этот список сократился только на 7 фамилий — а 250 фамилий (мы их привели в табл. 7.3.4.) оказались общими для всех шести регионов! В среднем, 13 % из «коренных» фамилий, встреченных в каком-либо регионе, оказываются всеобщими, присутствуют и в других регионах. Это очень большая величина — раньше считалось, что таких фамилий почти нет, и поэтому сравнение удалённых регионов не имеет смысла, но к счастью, это оказалось не так.
3) ИНДЕКС МЕСТА. В общерусском списке все 67 тысяч фамилий мы расставили по убыванию их средней частоты. Значит, у каждой фамилии есть свой номер, её «ранг», её место среди всех русских фамилий. У группы фамилий тоже есть её «ранг» — среднее место входящих в неё фамилий. Именно эту величину мы и называем индексом места. Пользуемся мы ей часто — это просто и эффективно.
Например, у нас есть список всех фамилий Западного региона, расположенных по их частоте в Западном регионе. Насколько этот список вторит «всеобщему»? Насколько «западные» фамилии совпадают со списком «всеобщих» фамилий? Чтобы ответить, нужно рассчитать индекс места для «западных» фамилий. Чтобы не считать индексы для тысяч фамилий, мы ограничиваемся расчётом для десяти самых частых фамилий. И эти показатели работают очень эффективно.
4) СРАВНЕНИЕ ПО ЧАСТОТАМ ФАМИЛИЙ. Здесь фамилии неотличимы от обычных генетических маркёров, и мы пользуемся обычными методами: рассчитываем генетические расстояния по частотам всех фамилий как бы по частотам аллелей, строим график многомерного шкалирования и так далее. Это позволило напрямую сравнить расстояния между регионами по частотам фамилий с расстояниями между популяциями из тех же регионов по частотам гаплогрупп Y хромосомы. Обнаружилась высокая корреляция (равная 0.6), доказывающая, что частоты фамилий достоверно свидетельствуют о «настоящем» сходстве популяций подобно «настоящим» генам.
5) СРАВНЕНИЕ ПО СЕМАНТИКЕ ФАМИЛИЙ. Мы уже говорили — такой анализ возможен только для фамилий. Каждая фамилия, встреченная в популяции, относится к тому или иному классу, и подсчитывается, какой процент фамилий приходится на каждый класс. Затем популяции сравниваются (на глазок или количественно) по полученным профилям классов фамилий. В этой книге мы классифицировали и сравнивали не все фамилии, а только «топ-50» каждого региона.
6) КАРТОГРАФИРОВАНИЕ ОТДЕЛЬНЫХ ФАМИЛИЙ. Здесь и статистический, и семантический подходы отходят в тень, и на сцене появляется карта — наш главный инструмент во всей книге. Картографирование фамилий ничем не отличается от картографирования распространения генов или любых других признаков.
Неожиданно и приятно для исследователя, любящего фамилии, что даже в географии отдельных фамилий явно видны пространственные закономерности. Даже такая, казалось бы, вездесущая фамилия, как Иванов, оказывается отнюдь не вездесущей. Её зона обитания — запад и север «исконного» русского ареала, а, например, на юге она редка. Тем самым мы попутно опровергаем миф о случайном, повсеместном, недавнем и неинтересном возникновении русских фамилий от имён — ведь если бы миф был верен, Ивановы встречались бы с одной и той же частотой повсюду, где крестили по православному календарю.