Стилистика и статистика
К сожалению, помимо многотомного «Словаря языка Пушкина» мы имеем лишь частотный словарь «Стихов о Прекрасной Даме» Блока, да два словаря, о которых только что шла речь выше. Вероятно, в недалеком будущем у исследователей будет достаточное число таких словарей. И тогда можно будет сопоставлять творчество различных поэтов одной эпохи (например, Блока и Брюсова, Маяковского и Хлебникова, Пастернака и Есенина, Мандельштама и Цветаевой, Багрицкого и Уткина), проводить сопоставление различных сборников и поэм одного и того же поэта (скажем, сопоставить «Сестру мою жизнь» не только с «Камнем» Мандельштама, но и с другими произведениями самого Пастернака — «Волнами», «Темами и вариациями», «Спекторским» и т. д.).
Не только на основании частотных словарей получаем мы возможность сделать доказательным то, что чувствуем лишь интуитивно, подсознательно. Методы статистики все шире проникают в литературоведение, поэтику, стилистику. С их помощью исследователи могут давать характеристику стилей различных авторов не только качественную, но и количественную.
Так, уже простой подсчет среднего количества слов в предложении позволяет характеризовать стиль того или иного писателя с помощью чисел. Как пишет советский математик Р. Л. Добрушин, «можно сказать: А. Н. Толстой предпочитает более длинные фразы, а А. И. Куприн — более короткие». А можно сказать и так: «Среднее число слов в фразе в произведении Толстого «Сестры» равно 11,9, а среднее число слов в фразе в произведении Куприна «Поединок» — 9,5». Разница будет примерно такая же, как если в одном случае ограничиться утверждением, что производство угля в Советском Союзе больше, чем в Англии, а в другом — привести конкретные цифры. Каждому ясна большая доказательность утверждения во втором случае».
Первую попытку применить статистику в литературоведении сделал почетный академик Н. А. Морозов, известный деятель «Народной воли», более четверти века проведший в одиночном заключении в Шлиссельбургской крепости. Правда, методика исследования его была несовершенна, что и отмечал крупнейший русский математик А. А. Марков сразу после выхода работы Морозова «Лингвистические спектры». «Только значительное расширение поля исследования (подсчет не пяти тысяч, а сотен тысяч знаков) может придать заключениям некоторую степень основательности, если только границы итогов различных писателей окажутся резко отделенными, а не обнаружится другое весьма вероятное обстоятельство, что итоги всех писателей будут колебаться около среднего числа, подчиняясь общим законам языка», — писал Марков в «Известиях Академии наук» в 1915 году.
Действительно, подсчеты показывают, что стиль отдельных писателей можно характеризовать статистически, употребление отдельных частей речи, типов предложений и т. д. подчиняется определенной вероятностной закономерности.
Приведем несколько примеров. На пятьсот знаменательных слов у Куприна приходится семьдесят семь глаголов, у Пушкина — сто десять, у Чехова — сто двадцать семь. В прозе Симонова на пятьсот слов приходится сто семьдесят существительных, сорок девять прилагательных, семьдесят три местоимения, сто одиннадцать глаголов. У Шолохова соответственно двести шестнадцать существительных, семьдесят семь прилагательных, тридцать девять местоимений, семьдесят семь глаголов.
Еще более характерны числа, говорящие о соотношениях между частями речи у того или иного автора. «Лермонтов видит и изображает мир, Действительность в большем разнообразии качественных характеристик, признаков, чем это делает Пушкин: в среднем у Лермонтова 39 имен существительных из каждых 100 получают признаки прилагательных, а у Пушкина таких существительных всего 25; значит, речь и мышление Пушкина предметнее, Лермонтова — «качественнее». О сходной особенности речи и мышления двух авторов говорит и соотношение «наречие — глагол»: в среднем у Лермонтова на 100 глаголов приходится 42 наречия, а у Пушкина — всего 26; а это означает, что речь и мышление Лермонтова активнее окрашивают воспринимаемые процессы, чем это делают речь и мышление Пушкина. Интересно и то, что соотношение «существительное — глагол» и «глагол — существительное и прилагательное» оказываются у Пушкина и Лермонтова статистически равными, что позволяет опровергать гипотезу об особой глагольности речевого стиля Пушкина», — пишет Б. Н. Головин в книге «Язык и статистика».
А вот какие интересные данные были получены после подсчета названий цветов у. разных авторов в их прозе и стихах. В стихах об Америке Маяковского на тысячу слов текста приходится восемь цветообозначений, а в прозе, говорящей о той же Америке, — только два слова на тысячу. В военной лирике Симонова названия цветов употребляются в восемь раз чаще, чем в его же рассказах военных лет.
Вездесущие числа
Мы уже говорили, что стиль каждого большого поэта и писателя имеет свои количественные характеристики. Они начинают служить филологам и литературоведам, позволяя решать спорные вопросы об авторстве с помощью чисел. Так, кстати сказать, решили давний вопрос «о дедушке Гомере»: был ли автором «Илиады» один человек или же, как полагали многие специалисты, «Илиада» — сборник героических песен, лишь по традиции приписываемый великому слепцу.
Текст «Илиады» набили на перфокарты, затем ЭВМ тщательно проанализировала, то есть пересчитала все ритмические особенности каждой главы эпоса. Подсчеты машины неопровержимо показали: автором поэмы мог быть только один человек. Все главы «Илиады» сохраняют общее ритмическое единство.
С помощью чисел ученые начинают решать не толь» ко практические, прикладные задачи языкознания и литературоведения, но и многие теоретические вопросы, Например, определять степень заимствования одного языка из словарного запаса другого. Как известно, заимствуются обычно слова, обозначающие предметы быта, культуры, труда, которых не было ранее у того или иного народа (естественно, что вместе с предметом заимствуется и его название). Например, русское слово спутник вошло во все языки мира, равно как французское одеколон, арабское жирафа, австралийское бумеранг и т. п.
Все языки мира равны, на любом из них можно выразить все, что выражено на другом языке. Заимствования не говорят о том, что тот язык, из которого заимствуются слова — лучший, а который заимствует — худший. Однако разные языки по-разному восприимчивы к этим заимствованиям. Удивительной консервативностью обладает исландский язык. Иностранные слова практически в него не попадают, а новому понятию или термин ну подбираются свои собственные определения, средствами самого исландского языка. И вот футбол по-исландски звучит как кнаттспурна, то есть пинание мяча; дыня — как троллепли (яблоко великана), мотороллер — это трещащая гадюка, кинофильм — живой образ, ракета — огненный полет и т. п.
Другие языки, наоборот, весьма восприимчивы к иностранным словам (вероятно, многие читатели знают о знаменитой полемике, которую вели в прошлом веке романтики и архаисты во главе с адмиралом Шишковым, предлагавшим калоши именовать мокроступами). В албанском языке, как показывают подсчеты, из пяти тысяч ста сорока слов собственными являются лишь четыреста тридцать слов, все остальные заимствованы из других языков. В армянском языке полторы тысячи слов из одной тысячи девятисот сорока заимствованы из персидского, греческого, сирийского, парфянского, арабского языков. В корейском языке до семидесяти процентов заимствований из китайского; в современном английском от пятидесяти до семидесяти процентов всех слов заимствованы из французского, латыни и другие романских языков.
Ученые смогли проследить динамику этих заимствований. Известный датский лингвист Отто Есперсен исследовал несколько томов «Большого Оксфордского словаря» английского языка, в котором собрано около полумиллиона различных слов. Вслед за ним А. С. Бо провел подсчеты по всем томам этого монументального издания. Оказалось, что если принять количество заимствований в течение 1100–1600 годов за сто процентов, то около шестидесяти процентов слов было заимствовано в 1100–1400 годах, около двадцати — в 1401–1500 годах и примерно столько же — в 1501–1600 годах.