Литмир - Электронная Библиотека
Содержание  
A
A

А. М. Замалиев, как и его башкирский коллега, утверждает, что наиболее научно ценными в истории изучения тюркской метрики являются те труды, в которых обосновывается силлабическая природа поэзии на этих языках. Отдельно подчеркивается, что по ошибочному пути в решении этой проблемы пошли казахский, киргизский и туркменский исследователи20. Ошибочным объявляется и утверждение Л. И. Тимофеева, что поэтам, создающим силлабические стихи, не свойственны представления об идеальной метрической схеме: «На самом деле наши поэты сочиняют силлабические стихи, опираясь именно на тот “идеальный закон”, который живет у них в душе или сознании» [Замалиев 2011: 16]. Создается впечатление, что вопрос о типе стихосложения в тюркских языках всегда являлся ключевым для этой научной сферы и усилия, которые предпринимают авторы, чтобы утвердить свой взгляд на этот предмет, отвлекаются от насущной проблемы накопления и описания материала, систематизация которого могла помочь в освещении других стиховедческих аспектов. Высказывания на эту тему можно встретить практически в любой около-стиховедческой работе о тюркской поэзии, ср.: «Нельзя не признать обоснованным и справедливым критический разбор мнений Ф. Е. Корша, А. П. Поцелуевского, М. А. Унгвицкой о силлабо-тоническом характере тюрского стиха» [Асланов 1968: 118].

Мы не подвергаем сомнению силлабическую природу башкирского советского стиха, хотя при этом нельзя исключать и отдельных пограничных случаев, появившихся в результате влияния на него инородных форм, и далее такие случаи нами будут рассмотрены. Однако мы хотели бы сразу отрешиться от политических и идеологических импликаций, стоящих за рассуждениями о принципе, лежащем в основе стихосложения. Каким бы ни был по своей природе башкирский стих, его культурная ценность самодостаточна и не может быть умалена или увеличена утверждениями о механизме, определяющем систему стихосложения.

3. Башкирская поэзия XX века. Характеристика корпуса

3.1. Поэтические корпуса и башкирский поэтический корпус

Материалом этого исследования стала созданная в XX веке поэзия на башкирском языке, объединённая в корпус. Корпус в том значении, которое здесь используется, – это электронная поисковая система. Поиск в ней осуществляется по коллекции текстов, а результатом поиска обычно являются контексты употребления слов или других языковых явлений, а также данные о частотности этих явлений в коллекции.

Обычно создатели корпусов стремятся к тому, чтобы текстовые коллекции были представительными, то есть достаточно большими, чтобы отражать устройство языка. В большом хорошем корпусе встретится всё, что есть в языке (слова, их значения, грамматические конструкции и т. д.).

Создатели корпусов стремятся также к тому, чтобы их корпуса были сбалансированными, то есть отражали бы реальное соотношение жанров в языке. Таким образом, если в хорошо сбалансированном корпусе какое-то слово (или грамматическое явление) встречается чаще, чем другое слово, то это значит, что оно встречается чаще и в языке.

Тексты, помещённые в корпус, специальным образом обрабатываются, чтобы из них можно было извлекать лингвистически значимую информацию. Такая обработка называется разметкой (или аннотацией). Она позволяет искать не просто слова, но и определённые грамматические формы и другие языковые явления.

Важным свойством применения корпуса как инструмента исследования становится количественный фактор, то есть возможность получить сведения о сравнительной распространённости того, что ищет пользователь.

Помимо больших корпусов, отражающих реальность языка, существуют и специализированные корпуса, необходимые для изучения какого-то аспекта языка и культуры. Создаются диалектные корпуса (отражающие систему диалектной речи), газетные корпуса (отражающие динамичные изменения в языке последнего времени, фиксируемые газетами), параллельные корпуса (отражающие межъязыковые соответствия).

Одной из разновидностей корпуса является поэтический корпус. Такого рода система позволяет не только искать нужные слова и другие языковые явления, но и делать это с учётом специфики стихотворного текста. Скажем, в поэтическом корпусе можно найти слово в строке, написанной определённым метром, или слово в позиции рифмы.

Пионерским в деле создания поэтических корпусов стал Поэтический корпус в составе Национального корпуса русского языка21 [Гришина и др. 2009], открытый для свободного доступа в 2006 году. Поисковая система корпуса настроена так, что с её помощью можно искать слова и конструкции, учитывая при поиске метр, стопность, строфику и другие характеристики стихотворения. Коллекция постоянно пополняется, и в 2015 году её объём превысил 10 млн словоупотреблений.

В литературе есть упоминание о существовавшем в 2004 году корпусе китайских поэтических текстов эпохи династии Тан [Duanmu 2004: 47], но сейчас этот корпус недоступен. Нужно добавить также, что для приобретения статуса поэтического корпуса в полном смысле недостаточно создать поиск по электронной коллекции стихотворных текстов, важна еще и специфическая стиховедческая разметка, отражающая формальные показатели стиха и дающая возможность пользователю искать с учетом этих показателей. Была ли такая разметка в китайском корпусе, неизвестно.

Вторым в этом ряду стал Башкирский поэтический корпус22, запущенный в октябре 2013 года [Орехов 2014а]. Тексты были морфологически и метрически размечены, а поиск позволяет находить слова и конструкции в строках определённого размера.

Вскоре после Башкирского поэтического корпуса в конце того же 2013 года завершилась первая фаза работы над Корпусом чешского стиха23 [Plecháč 2015]. Все тексты получили морфологическую, метрическую и строфическую разметку, а также некоторые дополнительные, облегчающие поиск уровни аннотации (восстановление словарной формы слова, фонетическую транскрипцию). Объём корпуса складывается в основном из поэтических произведений конца XIX и начала XX века, и на 2019 год составляет 76 699 стихотворений, 2 664 989 строк и 14 592 037 словоупотреблений.

3.2. Репрезентативность и сбалансированность корпуса

3.2.1. Оценка сбалансированности

Так как дальнейшие выводы будут основаны на подсчётах и статистических методах, апробированных в корпусной лингвистике, нужно убедиться, что собранная коллекция (мы также по статистической традиции будем называть её «выборкой») отвечает требованиям репрезентативности и сбалансированности.

В корпус вошли поэтические произведения 103 башкирских поэтов, творческая активность которых приходится на XX век. Стихотворений в выборке: 17 895, их общий объём 468 456 стихотворных строк и 1,77 млн словоупотреблений. «Зачинателем башкирской советской литературы был Мажит Гафури, начавший писать в 1902 году» [Вместо предисловия 1950: 5], он (годы жизни: 1880‒1934) является самым старым автором в корпусе, и ему принадлежат наиболее ранние стихотворения коллекции, датируемые 1902 годом. Корпус доведён до 2000-х годов, последнее включённое в него стихотворение – «Көндән-көнгә бойоғамын һаман…» (2005) Мустая Карима (1919‒2005). Полный список авторов, включённых в корпус, можно найти в Приложении 1. Коллекция отражает только книжные издания поэтических произведений, в нее не попали публикации в периодике. Из стихотворений, написанных до введения в башкирской печати кириллического алфавита, в корпусе есть только те, которые были позднее переизданы в современной графике. Оригинальные публикации на арабице и латинице в качестве источника нами не рассматривались.

Можно измерить долю участия каждого автора в коллекции по трём параметрам: число стихотворений, число стихотворных строк, число словоупотреблений. Интуитивно кажется, что эти параметры зависят друг от друга, то есть если растёт один, то растёт и другой: чем больше стихотворений одного поэта появится в корпусе, тем больше принадлежащих ему строк и словоупотреблений мы обнаружим в корпусе. Эта зависимость может нарушаться в случае, если при составлении коллекции в неё попадёт небольшое число произведений одного автора, которые, однако, будут иметь аномальную длину. Проверим ситуацию в корпусе. Мы используем для этого коэффициент корреляции Пирсона. Он принимает значения от −1 до 1. Значение близкое к 1 означает высокую степень корреляции, то есть в случае, если какой-то параметр будет расти для некоторого измерения, то и другой параметр для того же измерения вырастет. Верно и обратное: падение одного параметра будет означать падение другого.

вернуться

20

За заметным межнациональным антагонизмом в наблюдаемой научной риторике стоит, по всей видимости, конструктивистская интенция, о которой говорилось выше.

вернуться

21

URL: http://ruscorpora.ru/search-poetic.html

вернуться

22

URL: http://web-corpora.net/bashcorpus/

вернуться

23

URL: http://www.versologie.cz/en/kcv.html

15
{"b":"668041","o":1}