Harasiuk, A. O., Myronov, M. V., Lozinsky, V. V., Nguyen Thanh Vy, Darchuk, A. V., and Prodeus, A. M.
Результати акустичної експертизи приміщень та засобів зв’язку, що полягає в оцінюванні розбірливості мовних сигналів, є необхідними для сертифікації приміщень та комунікаційних систем. Оскільки технічні засоби звукоінженерів постійно змінюються й удосконалюються, а також з огляду на зростання переліку факторів, що можуть бути врахованими при оцінюванні розбірливості мови, зростає й кількість апаратно-програмних додатків для такого оцінювання. Таким чином, розробка математичного та програмного забезпечення для прогнозування та вимірювання розбірливості мови є актуальним завданням. Найбільш поширеними на сьогодні є формантний та модуляційний методи оцінювання розбірливості мови. Формантний метод є дещо обмеженим, оскільки не дозволяє враховувати дію реверберації. Модуляційний метод, в якому мірою оцінювання розбірливості мови є індекс передачі мови (Speech Transmission Index), є вільним від цього недоліку. Тому в деяких роботах можна зустріти висловлювання про «застарілість» формантного методу. Проте, ретельне зіставлення потенційних можливостей формантного та модуляційного методів свідчить, що формантний метод перевершує свого конкурента за точністю і швидкістю обчислень в умовах, коли дія шуму переважає над дією реверберації. Найбільшого поширення набули такі версії формантного методу оцінювання розбірливості мови як індекс артикуляції (Articulation Index) й індекс розбірливості мови (Speech Intelligibility Index). На території колишнього СРСР найбільш поширеними були версії формантного методу, розвинуті в наукових школах, очолюваних Н. Б. Покровським, М. А. Сапожковим і Ю. С. Биковим. Згідно із формантним методом, область частот мовного сигналу розбивають на суміжні частотні смуги, в межах кожної з яких спектри мови та шуму можна вважати практично незмінними, й формантну розбірливість обчислюють як певну функцію парціальних відношень сигнал-шум, а словесну розбірливість обчислюють через формантну розбірливість. У даній статті представлено детальний опис алгоритму прогнозування розбірливості мови шляхом аналітичного моделювання. У загальному вигляді алгоритм складається з наступних кроків: на першому етапі обчислень здійснюється формування первинних моделей мовного сигналу і шуму у вигляді масивів вибірок стаціонарних випадкових процесів із заданими спектральними характеристиками. Потім виконується корекція дисперсій цих модельних процесів, щоб забезпечити необхідне інтегральне відношення сигнал-шум. Після такої корекції оцінюються парціальні відношення сигнал-шум. На заключному етапі обчислюються показники розбірливості мови, такі як формантна розбірливість, словесна розбірливість, індекс передачі мови. Працездатність запропонованого алгоритму перевірена для 4-х видів шумової завади: білої, рожевої, коричневої та типової для навчальних приміщень. Узгодженість отриманих результатів з відомими аналогічними результатами свідчить про коректність запропонованих компонентів аналітичного алгоритму. Окрім того, виконано співставлення результатів оцінювання розбірливості мови, отриманих у відповідності до «класичного» підходу, з результатами оцінювання індексу передачі мови, що дозволило підтвердити тезу про низьку маскувальну здатність білого шуму при малих відношеннях сигнал-шум. Запропонований в даній роботі алгоритм прогнозування розбірливості мови буде корисним студентам в галузі звукоінженерії, фахівцям в галузях розробки та налагодження систем зв’язку, архітектурного проектування, озвучення залів різного призначення, а також керівникам установ, де розбірливість мови є важливим показником. A detailed description of the speech intelligibility prediction algorithm using analytical modeling is presented. The efficiency of the proposed algorithm is tested for four types of noise interference: white, pink, brown and typical for classrooms. The consistency of the results with known similar results indicates the correctness of the proposed components of the analytical algorithm. In addition, we compared the results of evaluating speech intelligibility obtained in accordance with the “classical” approach with the results of evaluating the STI index of speech intelligibility, which allowed us to confirm the thesis of a low camouflage ability of white noise at low signal-to-noise ratios. Представлено детальное описание алгоритма прогнозирования разборчивости речи методом аналитического моделирования. Работоспособность предложенного алгоритма проверена для 4-х видов шумовой помехи: белой, розовой, коричневой и типовой для учебных помещений. Согласованность полученных результатов с известными аналогичными результатами свидетельствует о корректности предложенных компонентов аналитического алгоритма. Кроме того, произведено сопоставление результатов оценивания разборчивости речи, полученных в соответствии с «классическим» подходом, с результатами оценивания индекса разборчивости речи STI, что позволило подтвердить тезис о низкой маскировочной способности белого шума при малых отношениях сигнал-шум.