Литмир - Электронная Библиотека

Вместе с тем ученые обнаружили парадоксальное, на первый взгляд, явление: чем «нужнее» или употребительнее буква, тем меньше информации она содержит. В частности, информационная насыщенность каждой буквы первой группы почти в два раза ниже, чем буквы третьей группы (1,97 и 3,79 бита). В практическом отношении это означает, что реконструкция текстов с опорой на буквы третьей группы быстрее и точнее, чем с опорой на буквы двух первых групп. На основании всех указанных подсчетов профессор Г.Н. Кечхуашвили пришел к интересному выводу, что оставшиеся в сокращенном или искаженном тексте буквы в силу своих статистических связей сами как бы диктуют человеку, имеющему опыт чтения на данном языке, чего и где недостает [55, с. 34].

Становится все яснее, что мы ничуть не отвлеклись в сторону, занявшись вопросом о вероятности появления отдельных букв в тексте. Закономерность, установленная для «правильных» букв алфавита, как нетрудно убедиться, действительна и в отношении «неправильных» букв, то есть опечаток. Согласившись с заключением исследователей, что линотипист делает в среднем пять процентов ошибок (к количеству набранных строк), логично предположить, что «жертвой» неправильных действий оператора скорее будет расхожая буква «о», чем редкая «ф». Срывы и отказы в действиях оператора несомненно корреспондируют с частотой употребления отдельных букв в печати, хотя нельзя забывать, конечно, и о таких факторах, как расположение букв на клавиатуре наборной машины (и в гнездах кассы) и умение быстро распознавать буквы в оригинале.

Эмпирические данные подтверждают, что опечатки действительно чаще всего связаны с буквами «о», «е», «а», «и», «т», «н», занимающими первые места в таблице частот.

Осторожности ради, не следует считать эти данные полными и окончательными, пока не произведены более капитальные исчисления. Однако уже сейчас ориентировочные значения частот появления отдельных букв алфавита в печати могут помочь в работе с печатными текстами, особенно в тех случаях, когда при переиздании ранее опубликованных произведений (например, сочинений классиков литературы и науки) необходимо идентифицировать (опознать) опечатку, то есть доказать, что в таком-то месте допущено искажение, а не приводятся подлинные слова автора.

Вот, кстати, любопытный пример, который сам, что называется, подвернулся под руку. В корректуре одной литературоведческой статьи оказалась такая фраза: «Есенин вернулся в Москву изМуренным, больным». Искаженное слово можно было прочесть двояко: и «измученным» и «изнуренным». На какой же букве споткнулся наборщик?

Прежде чем обратиться к первоисточнику (приведенная фраза — это цитата из книги), мы решили справиться в таблице частот букв русского алфавита. Ориентировочное значение частоты для буквы «н» равняется 0,053, а для буквы «ч» намного меньше — 0,012. Заглянув после этого в книгу, мы прочитали именно то, что было подсказано математикой: «Есенин вернулся в Москву изнуренным, больным».

Это маленькое «открытие» настолько нас заинтересовало, что мы решили проверить, как часто случаи смешения букв в наборе (известно, что это самый распространенный вид опечаток) подчиняются математическим закономерностям. С этой целью мы взяли первый попавшийся лист корректуры и выписали из него ряд ошибочных букв, стоявших на месте правильных: «к» вместо «н», «ц» вместо «з», «в» вместо «н», «д» вместо «р», «п» вместо «с», «а» вместо «о», даже «ы» вместо «а» и т.д.

Затем по таблице частот мы убедились, что в 75% случаев неверные буквы имели меньшие ориентировочные значения, чем буквы, которые должны были стоять в данном слове (например, для «к» значение равно 0,028; а для «н» — 0,053). Этот несложный эксперимент, разумеется, нельзя признать строго научным, но он подтверждает, что в работе текстолога или корректора нельзя пренебрегать таблицей частот (она опубликована в книге А. М. и И. М. Ягломов и в ряде других источников).

Относительные частоты букв

—  0,175; о — 0,090; е, ё — 0,072; а — 0,062; и — 0,062; т — 0,053; н — 0,053; с — 0,045;

р — 0,040; в — 0,038; л — 0,035; к — 0,028; м — 0,026; д — 0,025; п — 0,023; у — 0,021;

я — 0,018; ы — 0,016; 3 — 0,016; ь, ъ — 0,014; б — 0,014; г — 0,013; ч — 0,012; й — 0,010;

x  — 0,009; ж — 0,007; ю — 0,006; ш — 0,006; ц — 0,004; щ — 0,003; э — 0,003; ф — 0,002.

Более того, можно было бы только приветствовать, если бы нашлись такие ревнители точности печатного слова, которые взяли бы на себя труд на большом материале проверить взаимозависимость употребления отдельных букв и вероятность появления опечаток. Кое-какие шаги в этом направлении предпринимались. Из упоминавшегося выше доклада на Ленинградской конференции по инженерной психологии [115, с. 28] мы знаем, что исследователи определили классы слов, в которых машинные наборщики часто делают ошибки, и составили ориентировочный словарь основных типов этих слов. Стало быть, наше предложение совпадает с направлением поисков, которые уже ведутся.

«Ловить» опечатки было бы довольно просто, если бы все происходило в полном соответствии с расчетами и прогнозами, то есть всегда была бы уверенность, что наступит данное событие, как говорят математики.

Но количество «составляющих» в процессе преобразования рукописи в книгу настолько велико, что, даже зная одну из них (те же частоты появления букв), мы вряд ли сумеем предусмотреть все остальные. В предыдущих главах уже говорилось об «осечках» глаза при чтении, о неисправностях машины, «подкидывающей» все новые ошибки в наборе, о физиологических факторах, влияющих на качество зрительной работы (например, усталость наборщика и корректора к концу смены, возрастные факторы, которым придавал большое значение И.П. Павлов). Все это умножает число досадных помех, затрудняющих борьбу с опечатками и ошибками в текстах.

Затрудняющих, но не отменяющих! В сущности, чем больше собрано материала для обсуждения, тем легче делать выводы и вносить предложения. В.И. Свинцов резонно указывает: «Каждая из ошибок в отдельности кажется оплошностью, недосмотром, но ведь многократно повторяющиеся случайности всегда выражают известную закономерность. Внимание корректора, позволяющее ему воспринимать грамматические связи почти автоматически, есть следствие знаний и соответствующей тренировки. И хотя логические связи по своей природе... существенно отличаются от грамматических, видимо, можно говорить также и о воспитании или даже тренировке логического внимания».

Мы всецело присоединяемся к выводу цитируемого автора: «И не играют ли здесь роль путеводителя сознательно приобретенные знания в сочетании с определенными практическими навыками?» [101, с. 18].

Фактор неопределенности значительно стушевывается благодаря действию важного явления, которое подметили исследователи литературных текстов. Это тщательно прослеженная и неоспоримо доказанная периодичность появления ошибок, описок и опечаток. Блестящий знаток рукописей Пушкина профессор С.М. Бонди, изучив наиболее характерные ошибки великого поэта как в стадии самого творчества, так и в процессе чисто механической работы переписывания черновика набело (то есть, по сути дела, создания оригинала для набора), заметил, что описки не только систематически повторяются, но существует какая-то видимая связь между ними. По наблюдениям С.М. Бонди, «описка, как беда по пословице, никогда (или почти никогда) не приходит одна. Как будто выбитый чем-то из колеи автоматически правильного письма писатель еще некоторое время продолжает находиться в этом состоянии; или, может быть, даже первая описка сама по себе нарушает этот автоматизм и влечет за собой и вторую». Поэтому исследователь дает деловой совет своим коллегам: «Всегда нужно быть готовым вслед за одной опиской сейчас же или вскоре ждать и вторую» [15, с. 594]

22
{"b":"573920","o":1}