И.А. Коноваленко

Среднеквадратичная невязка координат как критерий точности нормализации изображений при оптическом распознавании документов

Оптическое распознавание текста на сделанном с произвольного ракурса изображении требует предварительной нормализации изображения – преобразования к такому виду, как если бы оно было получено с удобного для распознавания ракурса. При этом неточности нормализации приводят к ошибкам распознавания. На сегодняшний день в литературе предложен ряд критериев точности нормализации, однако их соответствие качеству распознавания не исследуется. В данной работе для случая документа фиксированной структуры введена нормальная вероятностная модель распознавания, в соответствии с которой вероятность верного распознавания символа падает по гауссиане с ростом невязки координат этого символа. Для этой модели доказано, что критерий точности нормализации изображения, равный среднеквадратичной по текстовым полям документа невязке координат, монотонно связан с вероятностью верного распознавания всего документа. Наконец, среднеквадратичная невязка координат для важнейшего случая проективной нормализации и состоящей из прямоугольников области интереса впервые были вычислена аналитически.

 

KEYWORDS: нормализация изображений, проективное преобразование, оптическое распознавание символов, распознавание документов, критерии точности, невязка координат