В контексте задачи стабилизации рассмотрены системы управления

В.В. Вьюгин, И.А. Стельмах, В.Г. Трунов

Адаптивный алгоритм отслеживания наилучшей траектории экспертных решений

Рассматривается задача принятия решений в режиме онлайн. Имеется набор методов (экспертов, алгоритмов), которые принимают решения (или выдают прогнозы) и несут потери вследствие неточности своих решений. Предложен адаптивный алгоритм, который агрегирует решения экспертов и несет потери, не превосходящие (с точностью до некоторой величины, называемой регретом) потери наилучшей комбинации экспертов распределенных по интервалу прогнозирования. Для построения алгоритма используется комбинация метода Fixed-Share и адаптивного алгоритма экспоненциального взвешивания экспертных решений AdaHedge. Получена оценка регрета предложенного алгоритма. В рамках данного подхода не делается никаких стохастических предположений об источнике исходных данных и об ограниченности потерь.

КЛЮЧЕВЫЕ СЛОВА: предсказания с использованием экспертных стратегий, принятие решений в режиме онлайн, алгоритм AdaHedge, алгоритм Fixed-Share, регрет, адаптивный параметр обучения