Рис. 1.2. Бесконечное разнообразие звуков возникает из-за движения воздуха и описывается небольшим количеством компонентов.
Высота
Высота – это то, что отличает “высокий” звук от “низкого”. Звук флейты мы называем высоким, а звук тубы – низким. То, что мы слышим и описываем этими терминами, является проявлением физического свойства частоты. Мы слышим высокий звук, когда колебания от высокого давления воздуха к низкому происходят очень быстро – с высокой частотой. Низким звукам соответствуют более медленные изменения давления воздуха – с низкой частотой (рис. 1.3). Высота звука – это категория восприятия, а частота – измеряемое физическое свойство. Нам следует хорошо понимать разницу между высотой и частотой, поскольку они не всегда идеально коррелируют.
Рис. 1.3. Серая волна описывает больше циклов (имеет большую частоту), чем черная, и поэтому звучала бы на более высокой ноте.
Частота не в качестве научной меры высоты звука, а как слово английского языка означает число каких-то событий за фиксированный интервал времени. Вы можете получать зарплату два раза в месяц. В городе Тампа во Флориде за год в среднем бывает 78 гроз. Я получаю спам по электронной почте 22 раза в неделю. Во всех этих случаях речь идет о частоте. Число колебаний давления воздуха в секунду отличает высоту звучания флейты от высоты звучания тубы. Число подобных событий в единицу времени (в секунду) измеряется в герцах (сокращенно Гц). Человеческое ухо воспринимает частоту колебаний давления воздуха в диапазоне от 20 до 20 000 Гц. Высоко звучащая флейта издает звуки с частотой от 250 до 2500 Гц, а низко звучащая туба – от 30 до 380 Гц. Забавно, что эти диапазоны частично перекрываются! Непременно напишу концерт для тубы и флейты, где более высокую партию будет исполнять туба.
Однако между частотой звука и высотой, которую мы слышим, не всегда соблюдается идеальная корреляция. Если мы улавливаем высоту звука (если этот звук можно пропеть), частота, на которой мы его пропоем, называется основной частотой. Волновые линии на рис. 1.4 имеют одинаковое количество пиков и провалов (примерно 35), так что номинально они имеют одну и ту же частоту. Однако они включаются и выключаются (модулируются) с разной скоростью. И высота слышимого нами звука определяется скоростью модуляции, а не частотой модулируемой волны.
Рис. 1.4. Черная и серая волны имеют одинаковую частоту. Однако скорость модуляции разная, то есть звук, обозначенный серой волной, включается и выключается быстрее, и поэтому он звучит выше, чем звук, обозначенный черной волной. Более быстрая модуляция звука, происходящая из-за более быстрых колебаний голосовых связок у женщин, объясняет более высокие голосовые ноты при произнесении одних и тех же слов.
Примером служит человеческий голос. Высота (основная частота) человеческой речи варьирует в диапазоне от 50 до 300 Гц. Основная частота речи соответствует скорости открытия и закрытия голосовых складок, приводимых в движение нашим дыханием. Скорость движения голосовых складок у мужчин самая низкая, так что у них более низкие голоса, а у детей – самая высокая, и голоса у них высокие. Интересно, что высота голоса разная не только у разных индивидуумов и разных полов, но связана и с некоторыми другими неожиданными факторами. Различия в основной частоте в целом наблюдаются у людей, говорящих на разных языках[10], а также в разных демографических группах людей, говорящих на одном и том же языке[11]. Возможно, вы и по себе заметили, что двуязычные люди обычно говорят на одном языке на более высоких нотах, чем на другом[12].
Тембр
В музыке тембр – важнейший параметр, позволяющий различить два инструмента, исполняющих одну и ту же ноту. В речи это главное средство для различения одного звука (гласного или согласного) от другого. Мужчина и женщина произносят одно и то же: основная частота (высота голоса) позволяет определить, кто есть кто. Женщина произносит два разных слова: тембр помогает отличить ее “со” от “су”. Физической мерой высоты звука является основная частота, а тембр определяется гармониками – более высокими частотами, чем основная частота.
Полезно знать, из каких частот состоит конкретный звук. Речь идет о так называемом звуковом спектре. Спектр камертона состоит из одной-единственной частоты и поэтому представляет собой одну тонкую вертикальную линию, как на верхней панели на рис. 1.5. У этого звука нет гармоник, только основная частота. Естественный звук, такой как “до” первой октавы в исполнении тромбона или кларнета, имеет пик в спектре на основной частоте “до” первой октавы, соответствующей 262 Гц, а также дополнительные пики на частотах, кратных основной частоте (524, 786 Гц и т. д.) Это и есть гармоники (гармонические обертоны). Как показано на средней и нижней панели на рис. 1.5, не все гармоники обладают одинаковой энергией. Относительный энергетический уровень гармоник является характеристикой тромбона и кларнета и объясняет, почему мы слышим разницу между ними. Уникальный характер гармоник определяется формой и конструкцией инструмента, производящего звук. Аналогичным образом форма и положение языка, губ и носа определяют спектр гармоник, характеризующих разные звуки речи.
В зависимости от положения губ и языка и от объема проходящего через рот и нос воздуха мы изменяем спектр издаваемого звука (какие-то из гармоник усиливаются), как показано на рис. 1.6. Хотя в спектре двух гласных звуков есть пики, отстоящие друг от друга на 100 Гц (поскольку в данном примере основная частота составляет 100 Гц), высота пиков, изображенных серыми линиями, очень разная. Это речевой аналог разницы между звуками тромбона и кларнета. В случае звука “и” два максимума серой линии приходятся на частоты 300 и 2300 Гц, в случае звука “у” они располагаются примерно на частотах 400 и 1000 Гц. Спектр речи имеет выпуклости – области с максимумом энергии, называемые формантами. Интересно, что эти полосы акустической энергии достаточно похожи у разных людей. Человек с высоким голосом имеет пики для звука “у” где-то в районе частот 400 и 1000 Гц, как и человек с низким голосом.
Рис. 1.5. Спектр камертона представляет собой единственную вертикальную линию на одной конкретной частоте – в данном случае 262 Гц, что соответствует ноте до первой октавы. В звуковом спектре инструмента, исполняющего ноту до, есть пик на частоте 262 Гц, а также несколько гармоник на кратных частотах. Звук “до” первой октавы в исполнении тромбона или кларнета имеет разный рисунок гармоник из-за резонансных характеристик этих инструментов. Спектры помогают понять, почему одна и та же нота до первой октавы звучит по-разному в исполнении разных инструментов (по оси x отложены частоты, по оси y – энергия).
Рис. 1.6. Вверху: спектр звука “и”, как в слове “лик”. Внизу: спектр звука “у”, как в слове “лук”. Оба звука имеют одинаковую основную частоту, но распределение энергии в гармониках различается принципиальным образом (по оси x отложены частоты, по оси y – энергия).
Таким образом, тембр – это восприятие звука, связанное с его гармоническим содержанием. Расположение гармоник и их относительная высота – физические свойства звука, позволяющие нам по тембру определять разницу между двумя инструментами или двумя голосами. В речи группы гармоник выделяются в спектре конкретных слов или слогов. Рисунок 1.7 иллюстрирует полный диапазон частот (основных частот и гармоник) голоса и некоторых музыкальных инструментов.