В.Н. Сорокин, И.В. Гераськин

Оценка длины речевого тракта

Исследовались два способа оценки длины речевого тракта, эквивалентной длине однородной акустической трубы. Один способ был основан на вычислении длины тракта по разности частот ближайших локальных максимумов спектра, находящихся выше 4 кГц. В другом способе длина тракта вычислялась по средней частоте второй форманты, определенной по частотам первых трех формант. Также рассматривались варианты анализа независимо от контекста и в зависимости от известных гласных звуков. Вероятность правильного распознавания пола диктора обоими способами составила около 13%, и практически не зависит от знания контекста. Вероятность правильного распознавания мужских голосов  по разности высших формант независимо от контекста составила около 31 %, а женских голосов - около 25.5%, а в зависимости от контекста – 37% и 31%, соответственно. При контекстно-независимом распознавании по средней частоте второй форманты вероятность правильного распознавания мужских голосов близка к 27%, а женских – к 21.5%, тогда как при контекстно-зависимом распознавании с известным типом гласного вероятность правильного распознавания мужских голосов повышается до 43%, а женских - до 35.5%.

 

КЛЮЧЕВЫЕ СЛОВА: длина речевого тракта, распознавание пола, распознавание диктора