(i) Вся коммуникация основывается на возможности выбора, или селекции, из множества альтернатив. В главе, посвященной семантике, мы увидим, что этот принцип дает нам толкование термина «значимый» (в одном из смыслов): языковая единица любого уровня не обладает значением в некотором данном контексте, если она полностью предсказуема в этом контексте.
(ii) Информационное содержание изменяется обратно пропорционально вероятности. Чем более предсказуема единица, тем меньше значения она несет. Этот принцип хорошо согласуется с мнением стилистов о том, что клише (или «избитые выражения» и «мертвые метафоры») менее действенны, чем более «оригинальные» обороты речи.
(iii) Избыточность субстанциальной реализации языковой единицы (ее «кодирования») измеряется разницей между количеством отличительных признаков субстанции, требуемых для ее отождествления, и ее информационным содержанием. Определенная степень избыточности необходима для противодействия шумам. Наше предшествующее рассуждение об устойчивости субстанции, в которой реализуется язык, и о необходимости некоторого «запаса прочности», позволяющего различать реализации контрастирующих элементов, можно также подвести под более общий принцип избыточности (ср. § 2.2.10).
(iv) Язык будет более эффективным (с точки зрения теории информации), если синтагматическая длина единиц будет обратно пропорциональна вероятности их появления. То, что в языке действительно имеет силу подобный принцип, подтверждается тем фактом, что наиболее употребительные слова и выражения обычно бывают более короткими. Это было сначала эмпирическим наблюдением, а не дедуктивным (подлежащим проверке) выводом из определенных теоретических предпосылок; в дальнейшем для выражения связи между длиной и частотой употребления была выработана специальная формула, известная как «закон Ципфа» (по имени ее автора). (Мы не будем приводить здесь «закон Ципфа» или обсуждать его математическую и лингвистическую основу; он подвергся видоизменениям в последующих работах.) В то же время следует признать, что длина слова в буквах или звуках (в том смысле, в каком мы употребляли термин «звук» до сих пор) не обязательно служит непосредственной мерой синтагматической длины. Этот чрезвычайно важный момент (к которому мы еще вернемся) не всегда подчеркивался в статистических исследованиях языка.
2.4.7. ДИАХРОНИЧЕСКИЕ ИМПЛИКАЦИИ *
Поскольку язык развивается во времени и «эволюционирует», удовлетворяя изменяющиеся потребности общества, его можно рассматривать как гомеостатическую (или «саморегулирующуюся») систему; при этом состояние языка в каждый данный момент «регулируется» двумя противоположными принципами. Первый из них (иногда называемый принципом «наименьшего усилия») заключается в тенденции увеличить до предела эффективность системы (в том смысле, в каком слово «эффективность» толковалось выше); его действие заключается в приближении синтагматической длины слов и высказываний к теоретическому идеалу. Другой принцип заключается в «стремлении быть понятым»; он тормозит действие принципа «наименьшего усилия» путем введения избыточности на разных уровнях. Следует, таким образом, ожидать стремления сохранить, при изменяющихся условиях общения, обе тенденции в равновесии. Из того, что среднее количество шумов постоянно для разных языков и разных стадий развития одного языка, следует, что степень избыточности языка постоянна. К несчастью, нельзя (по крайней мере в настоящее время) проверить гипотезу о том, что языки сохраняют оба названных противоположных принципа в «гомеостатичееком равновесии». (Мы рассмотрим этот вопрос ниже.) Тем не менее эта гипотеза является многообещающей. Ее вероятность поддерживается «законом Ципфа», а также тенденцией (отмеченной задолго до начала теоретико-информационной эры) к замене слов более длинными (и более «яркими») синонимами, особенно в разговорном языке, в тех случаях, когда частое употребление тех или иных слов лишает их «силы» (снижая их информационное содержание). Крайняя быстрота смены жаргонных выражений объясняется именно этим.
Так же можно объяснить явление «омонимического конфликта» и его диахроническое разрешение (с большой полнотой проиллюстрированное Жильероном и его последователями). «Омонимический конфликт» может возникнуть тогда, когда принцип «наименьшего усилия», действуя совместно с другими факторами, обусловливающими звуковые изменения, приводит к снижению или уничтожению «запаса прочности», необходимого для различения субстанциальных реализаций двух слов, и таким образом к образованию омонимии. (Термин «омонимия» в наши дни обычно употребляется и по отношению к омофонии, и по отношению к омографии; ср. § 1.4.2. В данном случае имеется в виду, конечно, омофония.) Если омонимы более или менее равновероятны в большом числе контекстов, «конфликт» обычно разрешается путем замены одного из этих слов. Хорошо известным примером служит исчезновение в современном английском литературном языке слова quean (первоначально означавшего 'женщина', а затем — 'распутница' или 'проститутка'), которое вступило в «конфликт» со словом queen 'королева' в результате утраты существовавшего ранее различия между гласными, представленными орфографически как еа и ее. Наиболее известным из специальной литературы примером омонимического конфликта является, вероятно, случай со словами, означающими 'кот' и 'петух' в диалектах юго-западной Франции. Различавшиеся как cattus и gallus в латинском языке, оба слова в результате звуковых изменений слились в [gat]. «Конфликт» был разрешен путем замены слова [gat] = 'петух' различными другими словами, в том числе местными вариантами слов faisan ('фазан') или vicaire ('викарий'). Использование второго из них, по-видимому, основано на уже существовавшей ранее в «жаргонном» употреблении связи между 'петухом' и 'викарием'. Теме «омонимия» посвящена весьма богатая литература (см. библиографию в конце книги).
2.4.8. УСЛОВНЫЕ ВЕРОЯТНОСТИ ПОЯВЛЕНИЯ
Как мы видели, появление отдельной единицы (звука или буквы, единицы выражения, слова и т. п.) может быть полностью или частично детерминировано контекстом. Теперь мы должны внести ясность в понятие контекстуальной детерминированности (или обусловленности) и вывести те импликации, которые оно имеет для лингвистической теории. Для простоты мы сначала ограничим свое внимание рассмотрением контекстуальной детерминированности, действующей в пределах синтагматически связанных единиц одного уровня языковой структуры; другими словами, мы в данный момент пренебрежем тем очень важным моментом, что комплексы единиц низшего уровня реализуют единицы высшего уровня, которые сами имеют контекстуально детерминированные вероятности.
Мы будем употреблять символы х и у как переменные, каждая из которых обозначает отдельную единицу или синтагматически связанную группу единиц; кроме того, мы допустим, что х и у сами находятся в синтагматической связи. (Например, на уровне единиц выражения х может обозначать /b/ или /b/ + /i/, а у — /t/ или /i/ + /t/; на уровне слов х может обозначать men 'мужчины' или old 'старые' + men, а у — sing 'петь' или sing + beautifully 'прекрасно'.) Как х, так и у имеют среднюю a priori вероятность появления — рх и ру соответственно. Подобным образом сочетание х + у имеет среднюю вероятность появления, которую мы обозначим как pху.
В предельном случае статистической независимости между х и у вероятность сочетания х + у будет равна произведению вероятностей х и у: рху = рх × ру. Этот фундаментальный принцип теории вероятности можно проиллюстрировать посредством простого числового примера. Рассмотрим числа от 10 до 39 (включительно) и обозначим через х и у цифры 2 и 7 в первой и второй позиции их десятичного представления: сочетание x и у будет, таким образом, обозначать число 27. В пределах рассматриваемого ряда чисел (исходя из предположения, что все 30 чисел равновероятны) рх = 1/3 и py = 1/10. Если бы мы «задумали число между 10 и 39» и попросили бы кого-нибудь отгадать задуманное число, его шанс угадать правильно (без помощи другой информации) был бы один из тридцати: рхy = 1/30. Но допустим, что мы сказали ему, что это число кратно 3. Ясно, что его шанс правильно отгадать вырастает до 1/10. С нашей точки зрения, более существенно (поскольку мы рассматриваем вероятность появления одного знака в контексте другого) то, что выбор одного из двух знаков не является больше статистически независимым от выбора другого. Вероятность у, если дано, что х = 2, равна 1/3, поскольку только три числа кратны 3 в данном ряду (21, 24, 27); а вероятность x, если дано, что у = 7, равна 1, поскольку только одно число в пределах данного ряда оканчивается на 7 и кратно 3. Можно обозначить эти равенства как py (x) = 1/3 и рх (у) = 1. Условная вероятность появления у в контексте х равна 1/3, а условная вероятность х при данном у равна 1. (Два выражения «в контексте» и «при данном» следует понимать как эквивалентные; оба употребительны в работах по статистической лингвистике.) Обобщая этот пример: если рх (у) = рх (то есть если вероятность х в контексте у равна его априорной, необусловленной, вероятности), то х является статистически независимым от у; если же вероятность появления х увеличивается или уменьшается с появлением у, то есть если рх (у) > рх или рх (у) > рх, то х «положительно» или «отрицательно» обусловлен у. Крайним случаем «положительной» обусловленности является, конечно, полная избыточность при рх (у) = 1 (у предполагает х), а крайним случаем «отрицательной» обусловленности — «невозможность», то есть рх (у) = 0 (у исключает х). Важно иметь в виду, что контекстуальная обусловленность может быть и «положительной» и «отрицательной» (в том смысле, в каком эти термины здесь употребляются), а также что вероятность х при данном у не всегда, а точнее, лишь в редких случаях, равна вероятности у при данном х.