Б.Р. Габдуллин, Д.С. Сенюшкин, А.С. Конушин

Практическое приложение методов многокритериальной оптимизации к задаче релокализации камеры

Релокализация камеры &emdash; фундаментальная задача в области компьютерного зрения. Сверточные нейронные сети показали впечатляющие результаты в решении этой задачи. В этой работе мы предлагаем рассмотреть исходную задачу совместной оценки сдвига и поворота камеры с точки зрения поиска Парето оптимального решения, доставляющего лучшее качество каждой из них. Мы рассматриваем практический аспект применения методов многокритериальной градиентной оптимизации для обучения нейросетевой модели, решающей задачу релокализации. Целью работы является апробация существующих методов и поиск наиболее подходящего решения для этого сценария. Мы демонстрируем, что применение подобного рода оптимизационных подходов при обучении нейронной сети повышает ее качество, при этом не требуя дополнительных данных на обучение и не увеличивая количество ее параметров. Исследование проведено в рамках методологии экспериментального машинного обучения. Представленные результаты получены на публично доступном наборе данных Microsoft 7SCENES.

КЛЮЧЕВЫЕ СЛОВА: Релокализация камеры, сверточная нейронная сеть, многокритериальная оптимизация.