Д. М. Ершова, А. В. Гайер, Д. П. Николаев, В. В. Арлазаров
Легковесная нейронная сеть с обучаемыми БИХ-фильтрами для сегментации документов, удостоверяющих личность
Локализация документов, удостоверяющих личность, на мобильных и встраиваемых устройствах представляет собой сложную задачу вследствие жестких ограничений на объем памяти и вычислительные ресурсы. В работе предлагается легковесная нейросетевая архитектура с блоком обучаемых БИХ-фильтров для задачи сегментации документов. Использование обучаемых БИХ-фильтров позволяет формировать теоретически неограниченное рецептивное поле без существенного увеличения числа параметров и вычислительной сложности. Предложенная модель содержит 36 тысяч параметров и требует 0.3 GFLOPs - на 32% меньше, чем у аналогов. Эксперименты на наборах MIDV-500 и MIDV-2019 показывают конкурентоспособное качество сегментации при малом числе параметров и операций.
КЛЮЧЕВЫЕ СЛОВА: распознавание документов, сверточные нейронные сети, документы, удостоверяющие личность, БИХ-фильтры, семантическая сегментация.