М.Д. Красильников, М.Ю. Никитин

GazeT: улучшение определения трехмерного вектора направления взгляда оператора

Определение направления взгляда — важная задача в области компьютерного зрения, находящая применение в различных сферах, таких как мониторинг водителей, контроль операторов сложных систем, маркетинг и разработка пользовательских интерфейсов. Существующие методы определения трёхмерного вектора взгляда требуют больших объёмов дорогостоящих данных для обучения нейросетевых моделей. В данной статье предлагается новый подход к улучшению определения трёхмерного вектора направления взгляда оператора, основанный на использовании большого количества данных, собранных для определения двухмерной точки фокусировки взгляда. Созданный набор данных GazeT, включающий более 144000 изображений от 6744 уникальных участников, позволил повысить точность моделей при решении задач определения двухмерной точки фокусировки взгляда, трёхмерного вектора направления взгляда, а также производных задач, таких как классификация направлений взгляда водителей. Результаты экспериментов подтверждают, что предложенный подход позволяет снизить зависимость от дорогостоящих трёхмерных данных и существенно улучшить качество работы алгоритмов определения направления взгляда.

КЛЮЧЕВЫЕ СЛОВА: направление взгляда, краудсорсинг, набор данных, сверточные нейронные сети.