Е.В. Бурнаев, А.В. Бернштейн

Моделирование многообразий в машинном обучении

Задачи предсказательного моделирования требуют обработки многомерных данных, и из-за “проклятия размерности” использование многих методов для их решения затруднено. В приложениях реальные данные зачастую занимают лишь малую часть пространства наблюдений, внутренняя размерность которого существенно ниже размерности самого пространства. Популярной моделью для таких данных является модель многообразия, в соответствии с которой данные лежат на неизвестном низкоразмерном многообразии (Data Manifold, DM), встроенном в окружающее высокоразмерное пространство. Задачи предсказательного моделирования, изучаемые в рамках этого предположения, называются задачами оценки многообразий, общей целью которых является обнаружение низкоразмерной структуры многомерных данных по заданной выборке точек. Если точки выборки порождаются в соответствии с неизвестной вероятностной мерой на DM, возникает потребность в моделировании многообразий при решении различных задач машинного обучения. В работе мы представим краткий обзор этих задач, и обозначим некоторые подходы к их решению.

 

KEYWORDS: снижение размерности, моделирование многообразий, предсказательное моделирование