В.Н.Сорокин, А.И.Цыплихин
Сегментация и распознавание гласных
Для сегментации речевого сигнала на квазистационарные участки использовалась
математическая модель восприятия речи. Детектирование гласных звуков выполнялось
синхронно с импульсами источника голосового возбуждения. Анализ формантных
частот производился на основе механизма латерального торможения в
спектрально-временной области. Статистический анализ результатов сегментации
выполнялся на базе речевых данных для 47 человек и нескольких типов телефонных
трубок и микрофонов с ручной разметкой на 127 типов артикуляторно-акустических
сегментов. Границы 85% сегментов были найдены правильно независимо от типа
сегмента. Среди них было правильно детектировано около 80% гласных.