А.С.Леонов, И.С.Макаров, В.Н.Сорокин, А.И.Цыплихин

Кодовая книга для речевых обратных задач

Обратная задача нахождения формы речевого тракта (или артикуляторных параметров) по акустическим данным сводится к поиску условного минимума некоторой целевой функции. В силу неоднозначности отображения пространства акустических параметров в пространство артикуляторных параметров такая задача минимизации является многоэкстремальной. Отбор наилучшего решения осуществляется в результате многократного запуска процесса оптимизации с начальными приближениями, выбранными специальным образом. Эти начальные приближения составляют кодовую книгу. Формирование кодовой книги само по себе требует решения некоторой обратной задачи. Ее решение, однако, облегчается возможностью использования траекторий некоторых точек внутри речевого тракта, измеренных с помощью микролучевого рентгеноскопа или электромагнитного артикулографа синхронно с записью речевого сигнала. Входные акустические параметры и структура кодовой книги зависят от типа речевого сегмента – гласного, назального, фрикативного или смычки. Квазистационарные сегменты описываются значениями артикуляторных параметров, содержащихся в каждой ячейке квантованных акустических параметров. Переходные процессы, характерные для взрывных согласных, описываются последовательностью акустических и артикуляторных параметров на некотором интервале времени.