В контексте задачи стабилизации рассмотрены системы управления

В.В. Вьюгин, В.Г. Трунов

Отслеживание оптимальной последовательности предсказательных стратегий

В рамках теории предсказания (принятия решений) с экспертами в режиме онлайн предложен адаптивный алгоритм, который агрегирует решения экспертных стратегий и несет потери, не превосходящие (с точностью до некоторой величины, называемой регретом) потери наилучшей комбинации экспертов, произвольным образом распределенных по интервалу прогнозирования. Алгоритм развивает метод Mixing Past Posteriors и алгоритм экспоненциального взвешивания экспертных решений AdaHedge, использующий адаптивный параметр обучения. Получена оценка регрета предложенного алгоритма. В рамках используемого подхода не делается никаких предположений о природе источника исходных данных и об ограниченности потерь экспертов. Приведены результаты численных экспериментов по смешиванию экспертных решений с помощью предложенного алгоритма в условиях высокой волатильности потерь экспертов.

КЛЮЧЕВЫЕ СЛОВА: алгоритмы распределения потерь в режиме онлайн, предсказания с использованием экспертных стратегий, схемы смешивания апостериорных распределений экспертов, адаптивный параметр обучения