Звуки речи


Речь состоит из звуков, организованных в определенные последовательности.
Аристотель в книге «Об истолковании»  определил  речь таким образом:   «Речь есть такое смысловое звукосочетание, части которого в отдельности что-то означают как оказывание. Отдельный же слог ... ничего не означает, а есть один только звук».
Если звук несет какую-либо функциональную нагрузку, то есть его замена приводит к изменению смысла словесного сообщения, его можно рассматривать как «элементарную единицу» речи. Например, слова лов, зов, ров, шов отличаются только первыми звуками, слова лак, лук, люк - вторыми, а слова воз, вор, вол - третьими звуками. Эти звуки называются фонемами и определяют смысл слова. Интерпретация смысла слова может, однако, определяться не фонемами, а содержанием предложения. Так, слова, совершенно идентичные по составу (коса - коса, ласка - ласка), имеют разное смысловое содержание в зависимости от контекста, в котором они представлены. Следует, наконец, отметить, что один и тот же звук может быть произнесен совершенно различно в разных словах, в зависимости от его сочетания с другими звуками (например, звук д в словах вдруг и днище). Фонемы используются лингвистами как минимальные единицы для характеристики языка. Количество лингвистических и психологических фонем, однако, неодинаково. Поэтому звуки речи классифицируются также и другими способами. В частности, анализируются связи между волновым фронтом звуков и операциями, которые необходимы для генерации звуков в анатомических структурах речевого аппарата. Кроме того, классификация звуков возможна по месту их образования в речевом аппарате.

Каждый звук речи имеет уникальную акустическую характеристику. Частотные составляющие такого звука отличаются не только у разных людей, но и у одного и того же человека в разных контекстах. Именно поэтому все еще остается открытым вопрос о том, какие акустические признаки используются человеком при анализе речевого сообщения. Более того, неизвестно, существуют ли вообще какие-то универсальные признаки.

При визуализации звуков речи исследователь получает данные, которые позволяют оценивать полосы частот, составляющих звук речи, их изменения во времени, сравнивать картины разных звуков, сходных или различных по звучанию либо месту их образования в речевом тракте.

Проще всего обстоит дело с гласными звуками. Еще Г. Гельмгольц установил для разных гласных те определенные «характеристические» области частот, которые возникают при произнесении этих звуков. Гласные звуки состоят из нескольких гармонических составляющих, причем самая низкая из них соответствует резонансной частоте колебаний голосовых связок и называется основным тоном. Физиолог Л. Германн собственный тон резонатора назвал «формантой». Этот термин, быстро привившийся в науке, применяется теперь не только для обозначения основного тона, но и для обозначения всех резонансных гармоник звука, издаваемого голосовыми связками. Каждый гласный звук состоит из множества формант, находящихся в кратных отношениях по частоте. Они дают довольно стационарную по характеристикам спектрограмму. Дифтонги характеризуются значительно более сложной спектральной картиной полос. Полосы изменяются по частотной шкале как по абсолютному положению, так и по соотношению во времени. Здесь наиболее ярко выступает частотная модуляция. Каждый согласный звук также имеет свою характерную область частот и их распределений. Например, свистящий согласный с имеет широкополосный спектр. Когда звук произносится, рот почти закрыт, струя воздуха испытывает сильное трение. Этот согласный генерируется без участия голосовых связок. Так получаются глухие фрикативные согласные звуки. Если этот же звук произнести с помощью голосовых связок, то он превратится в согласный з (звонкий фрикативный звук). Для звонкого звука з характерны формантные полосы, смешанные с широкополосным шумом. Взрывные согласные звуки имеют очень короткую длительность. Они получаются в результате приостановки дыхания и задержки потока выдыхаемого воздуха в различных частях речевого тракта. Согласные типа р дают картину амплитудной модуляции.

Простое рассмотрение и сравнение спектрограмм речи дает основание полагать, что в них можно выделить некоторые характерные свойства, которые используются слухом при опознании звуков речи. Действительно, в специальных исследованиях с естественными и искусственно созданными (синтезированными) звуками речи были выявлены некоторые параметры, определяющие опознание и классификацию звуков. В частности, оказалось, что стационарные гласные идентифицируются преимущественно по соотношению первой и второй формант, хотя третья форманта оказывает влияние на тембровые характеристики гласных. Комбинация двух фонем дает переходный процесс, представляющий собой, как правило, кратковременный частотно-модулированный компонент, очень существенный для идентификации односложных слов. Согласные звуки идентифицируются по характеру ширины полосы спектра и наличию или отсутствию в нем гармонических составляющих. Взрывные согласные идентифицируются не только по спектру и длительности, но и по переходному процессу перед второй формантой последующего гласного. Изменение первой форманты обеспечивает различение между звонкими (г, д, б) и глухими (к, т, га) взрывными согласными.

В звуках человеческой речи выделяются по крайней мере несколько компонентов, на основе которых данный звук может быть идентифицирован слухом. Это частотный компонент постоянной частоты, соотношение частот, их абсолютные значения, шумовой компонент и частотная модуляция. И хотя достигнуты большие успехи при изучении восприятия звуков речи, вопрос об огромной дистанции между восприятием звуков и даже слогов и слитной речи в целом остается открытым.

© 2008 - 2017 Звук и Слух  Копирование материалов сайта запрещено. Все права на публикуемые материалы принадлежат их правообладателям.