Журнал "Радуга звуков" №2 за 2020 год | Page 43

© « Радуга звуков » • № 2 ( 77 ) • Ноябрь 2020 | 43

Основные технологии , используемые в слуховых аппаратах , ориентированы на понимание речи . Их задача заключается в распознавании речевого или шумового сигнала , который попадает в аппараты . После этого , в зависимости от акустической ситуации , в аппаратах активируются функции , помогающие сделать речь понятной даже на фоне шума . Однако при передаче музыки такой алгоритм обработки звука может привести к тому , что она , особенно живая , будет звучать неестественно . Чтобы понять причины этого явления , более подробно рассмотрим свойства речи и музыки .

Характеристики речи , шумов и музыки
Рис . 1 . Слева запись типичного речевого сигнала , справа запись звука фортепиано .
Рис . 2 . Слева типичный шум , справа запись звучания скрипки .
Важная основа для распознавания речи и шумов – разные характерные степени модуляции обоих сигналов . Модуляция – это изменение уровня громкости звука с течением времени . Речь , как правило , имеет сильную модуляцию , в отличие от большинства шумовых сигналов , которые ее не имеют вовсе . Покажем это на следующем примере . На левой части Рисунка 1 показана осциллограмма фразы , произнесенной вслух . На ней хорошо видны тихие и громкие компоненты речевого сигнала , а также характерные речевые паузы . В левой части Рисунка 2 изображен немодулированный равномерный шумовой сигнал ( в данном случае – звук работающей электрической зубной щетки ). На основе результатов разных графиков протекания автоматическая система слухового аппарата определяет – речь это или шум . Но именно то , что великолепно работает в отношении речи и шума , создает трудности при передаче музыки . Наглядно это показано на правых частях Рисунков 1 и 2 . На Рисунке 1 справа показана осциллограмма отрывка из фортепианной Сонаты № 11 ля мажор В . А . Моцарта под названием « Турецкий марш ». Она очень напоминает график речевого сигнала . На Рисунке 2 справа – осциллограмма отрывка скрипичного соло из Концерта для скрипки с оркестром ре мажор П . И . Чайковского . На всем протяжении этого отрезка мы видим равномерную модуляцию , характерную для шума . Если оба отрывка будет слушать пользователь слуховых аппаратов , перед ним возникнет дилемма , какую программу необходимо включить , потому что в этой ситуации он не может использовать ни настройку , ориентированную на речь , ни настройку , направленную на подавление шума .
Динамические различия
В течение многих лет ученые детально изучают различные способы обработки сигнала для того , чтобы улучшить понимание речи с помощью слуховых аппаратов . Известно , что тихая речь имеет уровень громкости примерно 50 дБ , а речь нормальной громкости – от 60 до 65 дБ . Поэтому слуховые аппараты и алгоритмы настройки , как правило , ориентируются на обработку сигналов с уровнем 65 дБ ± 12 дБ . В отличие от этого , в музыке наблюдаются совершенно другие уровни громкости . Исследования показывают , что живая музыка с легкостью достигает уровня 105 дБ . А во время концерта симфонической музыки пиковые уровни звука в зале могут доходить до величин от 115 до 120 дБ .
Для слуховых аппаратов и их настройки это означает две важные вещи .
Во-первых , аппараты используют так называемую компрессию высокого уровня . Ее задача – препятствовать тому , чтобы очень громкие сигналы попадали в слуховой аппарат и перегружали его процессор . Так , например , у большинства моделей цифровых аппаратов пороги компрессии такой системы равны 95 дБ , что соответствует уровню громкости пневматического отбойного молотка на расстоянии 10 м или проезжающего мимо грузовика . То есть этого порога компрессии абсолютно достаточно для повседневной жизни , потому что даже очень громкая речь практически никогда не превышает уровня 82 дБ . Когда музыка звучит из динамика мобильного телефона или телевизора , она тоже редко превышает уровень 95 дБ . Но для живой музыки , громкость которой заметно превышает 100 дБ , компрессия высокого уровня превращается в препятствие , так как она сжимает входной сигнал , и музыка может звучать сдавленно и плоско . Разные производители используют различные алгоритмы компрессии высокого уровня . Поэтому специалисты рекомендуют обращать внимание на этот параметр , если речь идет о подборе слухового аппарата для меломана .
Вторая трудность связана с динамическими различиями между музыкой и речью , такими как коэффициент амплитуды , он же пик-фактор ( crest factor ), который обозначает разницу в дБ между пиковым значением и средней громкостью сигнала . Эта акустическая характеристика имеет колоссальную важность для тембров разных музыкальных инструментов и их динамического диапазона , и колеблется она в диапазоне от