Следует, впрочем, учесть возможность неправильного понимания соотношения анализа и синтеза. Тот факт, что грамматика нейтральна по отношению к анализу и синтезу, не означает, что анализ — это просто нечто обратное синтезу (или vice versa). Не следует, например, полагать, что программа вычислительной машины могла бы проходить «сверху вниз» по набору правил (и от грамматики к словарю) при «образовании» предложений и «снизу вверх по тому же набору правил (и от словаря к грамматике) при «рас познавании» конкретного корпуса материала. Как «образование», так и «распознавание», производится ли оно говорящими и слушающими или компьютером, предназначенным для моделирования их речевого «поведения», по-видимому, предусматривают «обратную связь» между этими двумя процессами (см. § 3.2.9). В исследовании этой проблемы с психологической точки зрения достигнуты пока лишь незначительные успехи; некоторые «психолингвистические» исследования были неудачными из-за непонимания того факта, что «генеративный» («порождающий») не означает «производящий». Отсюда этот предостерегающий абзац.
4.3.2. ПРАВИЛА ЛЕКСИЧЕСКОЙ СУБСТИТУЦИИ
Теперь мы можем вернуться к обсуждению структуры словаря. Для простоты будем по-прежнему опираться на наше весьма простое представление о грамматических правилах. Хотя оно будет пересмотрено в последующих главах, этот пересмотр не окажет влияния на сделанные здесь общие утверждения. Итак, вернемся к первому правилу, использованному в предыдущем разделе:
Σ1 : T + N + V + T + N,
и к предполагаемым им классам слов:
T = {the}
N = {man, dog, chimpanzee, . . .}
V = {bites, eats, opens, . . .}.
Процесс лексической субституции (подстановка конкретных слов на позиции, установленные соответствующим грамматическим правилом; см. § 4.2.9) можно описать следующим образом: каждый случай появления символа грамматического класса в структурном описании предложения заменяется на любой член означенного класса, причем этот член берется из списка данного класса, приведенного в словаре. (Когда все символы грамматических классов заменены, или «переписаны», посредством многократного применения принципа лексической субституции, на «выходе» генеративной системы получается предложение, снабженное соответствующим структурным описанием.) Операция лексической субституции может быть формализована посредством следующего правила:
Х → х|х ∈ Х.
«Замени X, где X — переменная, принимающая значение всех грамматических классов, упоминаемых в генеративной системе (например, Т, N или V), на х, где х — любой член класса X». Последовательное применение этого правила лексической субституции превратит T + N + V + T + N в некоторое предложение типа The dog bites the man, как это представлено деревом на рис. 5. (Заметим, что различие между той частью «выхода», которая выводится из грамматического правила, и частью, полученной из словаря, представлено на дереве различием между сплошной и прерывистой линией. В настоящей работе мы будем везде придерживаться этого удобного соглашения.)
Рис. 5.
Поскольку правила лексической субституции действуют одинаковым образом, независимо от «значения», принимаемого Х-ом, мы можем рассматривать списки слов как множество правил, прилагаемых к грамматике, и таким образом обойтись без обобщенного правила лексической субституции. Принимая эту точку зрения (которую мы вскоре пересмотрим), мы следуем практике Хомского и других авторов первых работ по генеративной грамматике. Мы можем, следовательно, организовать словарь так, чтобы он принял следующую форму:
T → {the}
N → {man, dog, chimpanzee, . . .}
V → {bites, eats, opens, . . .}.
Стрелки можно интерпретировать как инструкцию заменить (или «переписать») элемент, находящийся слева от стрелки, на один из элементов, перечисленных справа от стрелки, например: 'y → z' означало бы «замени у на z (при условиях, определяющих систему правил)». Любая система правил, каждое из которых представлено в такой форме (способ их действия будет более подробно рассмотрен в гл. 6), называется системой подстановки (или системой правил подстановки).
Теперь используем стрелку подстановки также и для грамматического правила и объединим грамматическое правило и правила лексической субституции в одну систему:
(1) Σ1 → T + N + V + T + N
(2) T → {the}
(3) N → {man, dog, chimpanzee, . . .}
(4) V → {bites, eats, opens, . . .}.
Это весьма простая генеративная грамматика, которую мы расширим, с тем чтобы она учитывала некоторые результаты деления классов слов на определенные подклассы.
В предыдущем разделе мы отмечали, что в рамках допущений, принятых нами при рассмотрении формальной грамматики, любая переклассификация слов в словаре производит не подклассы исходных более широких классов, а совершенно не связанные друг с другом новые классы. С грамматической точки зрения этот недостаток может быть исправлен посредством введения добавочных правил, а именно:
N → {Na, Nb, Nc}
V → {Vd, Ve, Vf}.
Теперь мы должны внести поправки в правила лексической субституции (увеличив их число). Таким образом, новая система, включающая грамматику и словарь, примет следующий вид:
(1) Σ1 → T + N + V + T + N
(2) N → {Na, Nb, Nc}
(3) V → {Vd, Ve, Vf}
(4) Na → {man, dog, chimpanzee, . . .}
(5) Nb → {banana, door, milk, . . .}
(6) Nc → {fact, meaning, structure, . . .}
(7) Vd → {eats, bites, frightens, . . .}
(8) Vd → {recognizes, . . .}
(9) Vf → {determines, . . .}.
Эта система правил формализует в пределах грамматики тот факт, что Na, Nb и Nc представляют собой подклассы N (члены этих подклассов — «существительные»), а Vd, Ve,и Vf - подклассы V (члены — «глаголы»). Следовательно, в целях формализации этого факта наша система вводит дополнительный «слой» грамматической структуры (ср. рис. 6, представляющий дополнительный «слой» посредством ветвей «дерева», связывающих N и Na и V и Vd). Однако это происходит за счет того, что система допускает в качестве грамматически правильных те самые сочетания подклассов, для запрещения которых и предназначался процесс субклассификации. (В вышеприведенном наборе правил нет никаких ограничений, препятствующих тому, чтобы избрать, скажем, Nb для заполнения второй позиции при Vd в третьей позиции и Nc в пятой позиции.)
Рис. 6.
Речь идет здесь о принципе синтагматической обусловленности, или совместимости, между одним и другим подклассом слов, то есть о том, что обычно называют лексической селекцией. На данном этапе мы занимаемся структурой словаря и не будем вдаваться в грамматические аспекты этой проблемы. Допустим просто, что в принципе возможна такая формализация (использующая контекстно-связанные правила; см. § 6.5.1), которая позволила бы нам сохранить понятие субклассификации, выраженное в правилах (2) и (3), и тем не менее порождать желаемые сочетания подклассов.
4.3.3. ГРАММАТИЧЕСКИЕ ПРИЗНАКИ *
Теперь мы можем представить себе все более и более дробную классификацию словаря языка (вплоть до «снижения рентабельности»). Грамматику можно расширить, например, таким образом, чтобы она включала такие добавочные правила, как