С помощью примерки на десятках таких манекенов постепенно вырабатывался наиболее эффективный способ расчета суммарной фонетической содержательности звуковой формы слов, то есть компьютер постепенно учился все лучше и лучше «понимать» фоносемантику, все точнее имитировать человеческое восприятие этого аспекта значения слова.
Вычислитель, собеседник, советчик
В основном техника компьютерных расчетов сводится к вычислению оценки, усредненной по всем средним оценкам составляющих слово звуков. Но есть и кое-какие тонкости.
Прежде всего: в какой форме задавать слова компьютеру? Мы всё говорим — звуки, звучание, звуковая форма слова... Но компьютер звучащей речи пока не воспринимает. Общаться с ним приходится письменно. А буквенная и звуковая формы слова — это не одно и то же. Мы пишем яблоко, но произносим на месте буквы я два звука ( i— йот, звук, близкий к й, плюс звук а), а на месте о вообще что-то непонятное — какой-то призвук, нечто среднее между а, о и ы. Пишем окно, а произносим почти акно, пишем солнце, а произносим сонце (опять-таки с непонятным звуком в конце), пишем любовь,, а произносим льубофь и т. д. и т. п. Как быть?
Для филолога неразличение звука и буквы — это смертный грех, даже вообразить себе такое немыслимо. Однако для обычного носителя русского языка между звуком и буквой нет такой уж непреодолимой пропасти. Например, в сознании (или подсознании) каждого грамотного человека звук и буква сливаются в единый психический образ. А формирует этот образ, фиксирует его, делает его более четким и определенным отнюдь не звук, а как раз буква. И сами отдельные звуки человек начинает осознавать только тогда, когда выучивает буквы. Неграмотный никаких звуков в слове не выделит. В лучшем случае выделит слоги. Спросите его, из каких звуков состоит слово мама, и он скажет: ма-ма. И только зная буквы, обычный носитель языка может указать звуки слова, но и тут будет постоянно сбиваться на буквы — они для него более реальны, более наглядны, определенны. Он обычно удивляется, если ему сказать, что в начале слова юг звучит вовсе не ю, а i+у. Запись jyк для него странна и непривычна. Спросите любого русского, какой звук звучит в конце слова любовь, и большинство скажет — вь, хотя совершенно явственно произносится фь.
Конечно, в школе учат различать звук и букву, поэтому сознанием человек может уяснить, что ю это не ю, а i+у. Но подсознательно он все равно считает ю единым звуком, или, лучше сказать, единой звукобуквой. Так что же, давать компьютеру буквы, да и все?
Нет, это тоже крайность. Есть, оказывается, психологически чрезвычайно важные моменты звучащей речи, которые в буквах не отражены. Любопытно, что если, скажем, француз или англичанин, не знающие русского языка, услышат слова мел и мель, то они будут уверены, что это одно слово. Разницу в их звучании они просто не уловят. И очень удивятся, если им сказать, что русские совершенно четко и определенно слышат здесь два разных слова, которые никогда не спутают. Так же как француз не может перепутать разные звуки е — открытый и закрытый, — тогда как русскому разница в их звучании представляется почти неуловимой.
Дело здесь в том, что в разных языках особенно важными становятся разные характеристики звуков речи. Для русских мягкость согласных чрезвычайно важна — она является смыслоразличительной, то есть от замены в слове одного только твердого звука на парный ему мягкий резко меняется смысл. Замените л в слове угол на ль — получится совсем другое слово уголь, хотя звучание изменилось чуть-чуть, еле заметно.
Иногда носителю одного языка кажется просто странным, что носитель другого языка не замечает таких, казалось бы, явных различий в звучании. Например, узбеки, изучая русский язык, поначалу путают п и ф.
Учительница, преподающая русский язык в узбекской школе, рассказывала:
— Диктую слово «профессор», а Сайд пишет на доске: «фропессор». Его дружок шипит с первой парты:
— Сайд, первая п — не такая п (руки в бока кренделем), а такая п (свесил руки коромыслом).
Русские удивляются: как же не замечать такой разницы? А удивляться-то нечему: в узбекском языке эта разница не играет никакой роли, вот они ее и не замечают.
Со мной был случай, когда я поразился собственной языковой «тугоухости». На одной конференции в перерыве мы беседовали с англичанином, который неплохо знал русский язык, но учил его в Англии и разных русских-говоров не слышал. И вдруг он меня спрашивает:
— Скажите, что такое по-русски «хайка»?
Я растерялся.
— Не знаю, — отвечаю, — такого слова. Где вы его слышали?
А рядом двое рабочих устанавливают к очередному докладу демонстрационную аппаратуру.
— Да вот же рабочий несколько раз сказал «хайка», — говорит англичанин.
И тут только меня осенило: рабочий произносил г-фрикативный на южнорусский манер. Получалось действительно вместо гайка почти что хайка. Говорящие по-русски замечают, конечно, эту черту произношения, но особенного значения ей не придают, потому что это изменение звучания хотя и очень резкое, но несмыслоразличительное, смысла слов оно не изменяет.
Зато уж если от произношения зависит смысл слова, то даже самые тонкие особенности звука становятся для носителя языка очень важными и заметными. Такова мягкость согласных для русских.
И в оценках содержательности звуков по измерительным шкалам разница твердых и мягких согласных проявляется совершенно определенно: твердые согласные «сильнее, мужественнее, грубее», тогда как мягкие — «слабее, женственнее, нежнее».
Что и говорить — компьютеру обязательно нужно учесть эту особенность восприятия звуков. Да только вот как получается — твердость и мягкость согласных, важнейшее свойство русских звуков речи, не отражено в буквах. В слове рад начальный согласный твердый, а в слове ряд — мягкий, но буква одна — р.
Пришлось обучать компьютер самостоятельно обнаруживать твердые и мягкие согласные. Правда, сделать это оказалось не так уж сложно, потому что согласные становятся мягкими в основном в определенных позициях, которые компьютер научился находить.
А что касается других различий звуков и букв, то они оказались либо практически несущественными для расчета фоносемантики слов, либо выбор пришлось сделать в пользу буквы, как то подсказала «примерка на манекенах». Для компьютера это большое удобство, так как слова можно вводить в обычном печатном виде. Компьютер сам устанавливает мягкость согласных и приступает к расчету содержательности «звукобуквенной» формы слов.
Да, форма не звуковая и не буквенная, а именно звукобуквенная. Например, слово любовь в таком виде и вводится в компьютер, но он преображает ее так: л'юбов' (апостроф — знак мягкости). Как видите, компьютер отметил мягкость звуков и в то же время сохранил букву ю. Но чтобы не вводить нового, непривычного термина, станем по-прежнему говорить «звук», и только там, где это необходимо для правильного понимания сказанного, будем употреблять термин «звукобуква».
В расчетах тоже есть свои особенности. Не все звуки в составе слова равноценны, не все вносят равный вклад в восприятие слова как единого звукобуквенного комплекса.
Ясно, что ударные гласные заметнее безударных. Они звучат четче, громче и дольше. Значит, их роль должна быть подчеркнута, вес их средних оценок при расчетах должен быть увеличен.
Но оказывается, первый звук слова информативно еще более важен, чем ударный. Действительно, все первое ново и свежо, особенно заметно, сразу бросается в глаза, выделяется, запоминается. Все последующее блекнет, становится обычным, теряет свою информативность. Так и в жизни, так и в слове. Первый звук слова своей содержательностью как бы задает тон, окраску всем последующим звукам, будто включает регистр, в котором будет звучать слово. Замените «красивый» звук мь на «отталкивающий» хь, и получится вместо красивого слова милый отталкивающее хилый. А ведь поменялись только первые звуки, остальные остались теми же. Или прочитайте наоборот нейтральное, не вызывающее никаких особых эмоций слово мах — получите «грубое» слово хам. Это «грубый» х, став первым, окрасил своей содержательностью всю звуковую форму слова. Следовательно, вес средней оценки первого звука тоже должен быть увеличен, и еще больше, чем ударного.