6.2.11. ФОРМАЛИЗАЦИЯ КОНТЕКСТНО-СВОБОДНЫХ ГРАММАТИК СТРУКТУРЫ НЕПОСРЕДСТВЕННЫХ СОСТАВЛЯЮЩИХ
Все приводимые до сих пор в этом разделе правила структуры составляющих имели общую форму А → В («Замени А на В при синтезе предложений»). О «значениях», принимаемых А и В, не было ничего сказано за исключением того, что первое правило системы должно иметь в качестве А (то есть в левой части) начальный символ Σ (предложение) и что терминальные символы (N, Vtr, Vintr, А и т. д.), встречающиеся в порождаемых грамматикой цепочках, обозначают лексические классы: N = {boy, girl,...}, Vtr = {eat, kill,...}, Vintr = {die, go,...}, Adj = {good, old,...}. Правила вида A → В, заменяющие А на В независимо от контекста А, называются контекстно-свободными правилами. (Мы вернемся к этому вопросу в § 6.5.1.)
В течение последних нескольких лет формальные свойства контекстно-свободных грамматик структуры составляющих подвергались интенсивному изучению. Хомский и другие рассматривали следствия упорядочения правил в системе, допущения как факультативных, так и обязательных правил, введения альтернативных подправил и наличия в системе рекурсивных правил. Кроме того, они отметили, что на значения А и В в правилах вида А → В должны накладываться два важных ограничения, чтобы грамматика, содержащая такие правила, могла приписывать каждому порождаемому предложению единственную структуру: (i) A и В не должны быть тождественными (то есть А не должно заменяться само на себя) и (ii) А должно быть единичным символом, хотя В может быть и обычно бывает цепочкой, содержащей более одного символа. Некоторые ученые использовали грамматики структуры составляющих, которые налагали на В более специфические ограничения, а именно требовали, чтобы В состояло из двух, и только двух, элементов (например: NP + VP или Vtr + N). Более полное объяснение сущности подобных ограничений читатель сможет найти в более специальных работах, указанных в примечаниях.
6.2.12. СИЛЬНАЯ И СЛАБАЯ ЭКВИВАЛЕНТНОСТЬ[42]
Самым важным результатом этого теоретического исследования грамматики (которое позаимствовало многое в исследованиях по формализованным системам логики и математики) явилась демонстрация того, что грамматики структуры составляющих с разными формальными свойствами могут порождать в точности одно и то же множество предложений. Грамматики, которые порождают одно и то же множество предложений, считаются слабо эквивалентными; грамматики, которые не только порождают одни и те же предложения, но и приписывают им одну и ту же структурную характеристику, считаются сильно эквивалентными. Чтобы пояснить различие между слабой и сильной эквивалентностью, рассмотрим грамматики структуры составляющих несколько иного типа но сравнению с теми, которые были рассмотрены выше, а именно «категориальные» грамматики.
6.3. КАТЕГОРИАЛЬНЫЕ ГРАММАТИКИ *
6.3.1. ОСНОВНЫЕ И ПРОИЗВОДНЫЕ КАТЕГОРИИ
Категориальные грамматики имеют своим источником труды польского логика Айдукевича (последователя Лесневского); затем они были разработаны Бар-Хиллелом, Ламбеком и другими современными логиками и лингвистами. (Выбор термина «категориальный» в этой связи объясняется частными деталями исторического развития логики и философии, в которые мы здесь не будем вдаваться.)
Категориальная система имеет две основные грамматические категории — предложение и существительное; мы будем изображать их как Σ и n соответственно. Всем лексическим единицам, отличным от существительных, придается производная категориальная классификация в лексиконе в соответствии с их способностью сочетаться друг с другом или с одной из основных категорий в структуре составляющих предложения. Производные категории являются сложными в том смысле, что они указывают одновременно: (i) с какой другой категорией может сочетаться рассматриваемый элемент для образования составляющей предложения и (И) категориальную классификацию составляющей, получающейся в результате этой операции, например: элемент типа run 'бежать' или exist 'существовать' («непереходный глагол») может сочетаться с существительным (в качестве «подлежащего»), образуя предложение, например: John ran 'Джон бежал' (мы продолжаем пренебрегать вопросом глагольного времени и особенностями «согласования»).
6.3.2. «СОКРАЩЕНИЕ»
В «квазиарифметической» системе обозначений Бар-Хиллела категориальная классификация элементов типа run может быть выражена в виде «дроби», знаменатель которой обозначает, с какой другой категорией run и т. п. может сочетаться, а числитель обозначает категорию результирующей конструкции. Таким образом, лексическая классификация элемента run и т. п. как
указывает на то, что такие элементы, сочетаясь с существительными, образуют предложения. Если дана такая классификация run, то при условии, что John — это (n), мы знаем, что John ran — грамматически правильное предложение. Можно автоматически установить этот факт посредством простого правила «сокращения», аналогичного арифметическим правилам сокращения; точно так же, как
так и
(то есть мы «сокращаем» числитель и знаменатель, когда они тождественны, и в данном случае остаемся с Σ — символом, указывающим, что это выражение является предложением; точка используется здесь для изображения линейной конкатенации). Но система должна быть также способна отвергнуть как грамматически неправильные такие последовательности, как
(Ran John). Мы, таким образом, должны точно указать
направление комбинаторной способности элемента — левое или правое. Мы будем обозначать его посредством стрелки, присоединенной к горизонтальной «дробной» линии; таким образом,
обозначает элемент, который сочетается с существительным, стоящим слева, образуя предложение, тогда как, скажем,
обозначает элемент (например, «прилагательное» типа poor 'бедный', old 'старый' и т. п.), который, сочетаясь с существительным, стоящим справа от него, образует имя (или именную группу).
6.3.3. БОЛЕЕ СЛОЖНЫЕ КАТЕГОРИИ
Производные категории могут иметь в качестве числителя или знаменателя не только основные категории, но также и производные категории. Например, «наречие», сочетаясь с «глаголом», стоящим слева от него, образует «глагол» (или глагольную группу); другими словами, оно сочетается со стоящим слева от него элементом, который, сочетаясь со стоящим слева от него именем, образует предложение (для простоты мы будем рассматривать только «непереходные глаголы» и пренебрегать тем фактом, что «наречия» могут быть также отнесены к другим категориальным классам). Это обозначается «дробью»:
6.3.4. ВОЗМОЖНЫЕ РАСШИРЕНИЯ
Категориальная система, только что описанная нами, сравнительно проста, но для наших целей она достаточно удовлетворительна. Это двунаправленная система в том смысле, что она предусматривает сочетания с элементами слева или справа; мы могли бы расширить ее разными способами (допустив возможность появления двух или более конкатенированных категорий в знаменателе производной категории; допустив возможность одновременного сочетания данного элемента как с элементом, стоящим слева, так и с элементом, стоящим справа, и т. д. — мы здесь не будем вдаваться в последствия такого расширения); с другой стороны, ее можно было бы ограничить (сделать однонаправленной), если допустить возможность сочетаний только в одном определенном направлении. Отметим также, что эта категориальная система, подобно рассмотренной выше системе «подстановок», не пригодна для описания прерывных составляющих (ср. § 6.2.8).