Ко всему сказанному следует добавить, что в прошлом в так называемой формальной школе литературоведения уже делалась попытка квантитативного исследования стиля писателей, когда производились подсчеты эпитетов, метафор, ритмо-мелодических элементов стиха. Однако эта попытка не получила своего дальнейшего развития.
Другое направление применения математических методов для изучения языковых явлений можно объединить под именем лингвостатистики. Оно стремится вторгнуться в основные вопросы теории языка и таким образом получить призвание в собственно лингвистической сфере. Для ознакомления с этим направлением лучше всего обратиться к уже упоминавшейся работе Хердана, по выражению одного из ее многочисленных рецензентов, «чудовищно претенциозной книге»[155], получившей, однако, широкий отклик среди языковедов[156]76. Ввиду того, что Хердан (на что уже указывалось выше) стремился собрать в своей книге все наиболее существенное в области применения математических методов к лингвистической проблематике, в его книге мы фактически имеем дело не столько с Херданом, сколько с целым направлением. Как показывает само название книги — «Язык как выбор и вероятность», — основное ее внимание направлено на выяснение того, что в языке предоставлено свободному выбору говорящего и что обусловлено имманентной структурой языка, точно так же, как и на определение количественного соотношения элементов первого и второго порядка. Книга Хердана дает почти исчерпывающую информацию о всех работах в этой области, проведенных представителями разных специальностей (философами, лингвистами, математиками, техниками), но не ограничивается этим и включает много оригинальных наблюдений, соображений и выводов самого автора. В качестве суммирующего труда она дает хорошее представление о применяемых квантитативных методах, и о достигаемых с их помощью результатах. Вопросы, которые мы условно объединяем в раздел лингвостатистики, трактуются во второй и четвертой частях книги.
Из множества случаев применения методов математической статистики к изучению лингвистических вопросов мы остановимся на наиболее общих, которые одновременно можно рассматривать и как наиболее типичные. Используя данные других авторов — Болдрини[157], Матезиуса[158], Мариотти[159], Ципфа[160], Диуэй[161] и др., а также приводя собственные исследования, определяющие относительную частоту распределения фонем, букв, длины слов (измеряемую количеством букв и слогов), грамматических форм и метрических элементов в латинском и греческом гекзаметре, Хердан устанавливает факт стабильности относительной частоты языковых элементов как общую характеристику всех лингвистических структур. Он выводит следующее правило: «Пропорции лингвистических элементов, принадлежащих тому или иному уровню или сфере лингвистического кодирования — фонологии, грамматике, метрике, — остаются более или менее постоянными для данного языка, в данный период его развития и в пределах достаточно обширных и беспристрастно проведенных наблюдений»[162]. Это правило, которое Хердан называет основным законом языка, он стремится определенным образом истолковать и расширить. «Он, — пишет Хердан об этом законе, — является выражением факта, что даже здесь, где человеческой воле и свободе выбора предоставлены широчайшие рамки, где сознательный выбор и беззаботная игра живо чередуются друг с другом, в целом существует значительная стабильность… Наши исследования обнаружили еще один фактор общего порядка: далеко идущее сходство между членами одного языкового коллектива наблюдается не только в системе фонем, в словаре и в грамматике, но также и в отношении частоты употребления конкретных фонем, лексических единиц (слов) и грамматических фонем и конструкций; другими словами, сходство не только в том, что используется, но также и в том, как часто используется»[163]. Такое положение обусловливается понятными причинами, но это дает повод для новых выводов. При исследовании различных текстов или отрезков данного языка, например, обнаруживается, что относительные частоты использования данной конкретной фонемы (или других речевых элементов) разными людьми остаются в основном одними и теми же. Это и приводит к истолковыванию индивидуальных форм речи как некоторых колебаний постоянной вероятности употребления рассматриваемой фонемы в данном языке. Таким образом получается, что в своей речевой деятельности человек подчинен определенным законам вероятности в отношении количества используемых лингвистических элементов. А тогда, когда мы наблюдаем огромное количество лингвистических элементов в большой совокупности текстов или речевых отрезков, у нас создается впечатление причинной зависимости в том смысле, что в данном случае имеет место также детерминирование и в отношении использования определенных лингвистических элементов. Другими словами, оказывается допустимым утверждать, что то, что с интуитивной точки зрения представляется причинным отношением, в квантитативном плане является вероятностью[164]. При этом очевидно, что чем больше совокупность обследываемых текстов или речевых отрезков, тем отчетливее будет проявляться стабильность относительной частоты употребления языковых элементов также и в индивидуальном использовании (закон больших чисел). Отсюда делается новый общий вывод о том, что язык есть массовое явление и должен трактоваться как таковое.
Указанные выводы, достигнутые на основании частотных исчислений фонетических элементов, слов и грамматических форм, которые в совокупности составляют язык, применяются затем к «статистической интерпретации» проводимого Соссюром разделения на «язык» (lalangue) и «речь» (laparole). По Соссюру, «язык» есть совокупность лингвистических привычек, которые делают возможным общение между членами данного языкового коллектива. Это социальная реальность, «массовое явление», обязательное для всего говорящего на данном языке народа. Хердан, как указывалось, доказывает, что члены единого языкового коллектива сходствуют друг с другом не только тем, что используют одни и те же фонемы, лексические единицы и грамматические формы, но и тем, что все эти элементы употребляются с одинаковой частотой. Таким образом, статистическое определение «языка» принимает у него следующую форму: «язык» (lalangue) есть совокупность общих лингвистических элементов плюс их относительная вероятность употребления.
Такое определение «языка» является исходным и для соответствующего статистического истолкования «речи», которая, согласно Соссюру, представляет собой индивидуальное высказывание. Противопоставляя «язык» как явление социальное «речи» как явлению индивидуальному, Соссюр писал: «Речь есть индивидуальный акт воли и понимания, в котором надлежит различать: 1. комбинации, при помощи которых говорящий субъект пользуется языковым кодексом с целью выражения своей личной мысли; 2. психофизический механизм, позволяющий ему объективировать эти комбинации»[165]. Поскольку «язык» в лингвостатистике рассматривается как совокупность элементов с определенной относительной вероятностью их употребления, постольку он включает в себя в качестве существеннейшей характеристики статистическую совокупность или ансамбль (популяцию) и может рассматриваться в этом аспекте. В соответствии с этим «речь» превращается в отдельную выборку, взятую из «языка» как статистической совокупности. Вероятность в данном случае обусловливается отношением «речи» к «языку» (в их «квантитативном» понимании), а распределение относительной частоты употребления разных элементов языка истолковывается как результат коллективного «выбора» (choice) в определенный хронологический период существования языка. Понимая, что такая трактовка различий «языка» и «речи» строится все же на совершенно иных основаниях, чем у Соссюра, Хердан пишет в этой связи: «Эта, видимо, незначительная модификация концепции Соссюра имеет то важное следствие, что «язык» (la langue) ныне приобретает существенную характеристику в виде статистической совокупности (популяции). Эта популяция характеризуется определенными относительными частотами или вероятностями колебаний, имея в виду, что каждый лингвистический элемент относится к определенному лингвистическому уровню. В этом случае «речь» (la parole) в соответствии со своим значением оказывается термином для определения статистических выборок, взятых из «языка» как статистической совокупности. Становится очевидным, что выбор (choice) выступает здесь в виде отношения «речи» к «языку», являясь отношением взятой наудачу выборки к статистической совокупности (популяции). Сам порядок распределения частоты, в качестве отложения речевой деятельности языкового коллектива в течение столетий, представляет собой элемент выбора (choice), но не индивидуального выбора, как в стиле, а коллективного выбора. Употребляя метафору, мы можем здесь говорить о выборе, сделанном духом языка, если мы понимаем под этим принципы лингвистической коммуникации, находящиеся в соответствии с комплексом психических данных членов конкретного языкового коллектива. Стабильность серий есть результат вероятности (chance)»[166].