В.Н.Сорокин, И.С.Макаров

Обратная задача для голосового источника

Исследовалась обратная задача относительно формы голосового источника. Входными параметрами для этой задачи служили либо сигнал-остаток, получаемый после обратной фильтрации речевого сигнала, либо текущий интеграл от этого остатка. Сам сигнал-остаток интерпретируется как производная от объемной скорости воздушного потока через голосовую щель, а его интеграл – как объемная скорость потока. Рассматривалось несколько способов решения обратной задачи. В одном из них обратная задача решалась вариационным методом с регуляризацией по Тихонову. В этом методе параметры модели ко-лебаний голосовых складок варьировались с целью минимизации целевого функционала, включающего в себя невязку между вычисленной по модели производной от объемной скорости и сигналом, полученным после обратной фильтрации. В другом методе сначала выполнялась оценка объемной скорости по сигналу обратной фильтрации, а затем эта объемная скорость использовалась для решения инвертированного уравнения динамики потока в голосовом источнике. Полученная оценка изменения площади голосовой щели на каждом периоде голосового источника аппроксимировалась по методу среднеквадратического минимума функцией, порождаемой моделью голосового источника. Этот метод оказался наиболее точным и устойчивым. Ошибки аппроксимации известной площади голосовой щели в этом методе находились в пределах до 0.1 % (синтетические гласные), 10 – 12 % (натуральные гласные с измеренной площадью голосовой щели).  Установлено, что правдоподобные оценки площади голосовой щели достигаются на близко расположенных микрофонах.