Д. А. Городиский, С. В. Зуев
Квантовое распознавание инцидентов среди событий информационной безопасности
В качестве модели машинного обучения используется квантовая нейронная сеть прямого распространения. Подготовка данных делается общепринятыми методами, но вместо нормализации используется приведение данных к целочисленным векторам, чтобы далее привести размерность данных к подходящим для квантовой нейронной сети значениям. Данные для анализа представляют собой обезличенные данные одного из центров обеспечения информационной безопасности, собранные в течение года. Средствами для исследования выбраны язык программирования Python и библиотеки с открытым кодом. В работе реализуется метод статистического машинного обучения, который позволяет производить обучение в реальном времени. В результате исследования построена интеллектуальная система, которая на основании значений признаков событий безопасности строит предположение о принадлежности события к классу инцидентов. Тем самым, система позволяет распознать событие, которое с повышенной вероятностью приведет к ущербу, и по которому оправдано незамедлительное реагирование. Работа системы верифицирована на реальных данных, которые характеризуются той же несбалансированностью, что и обучающие выборки событий информационной безопасности, то есть имеет очень низкую долю инцидентов (менее одного процента). Было установлено, что квантовая модель с тремя кубитами достигла полноты (recall) 100% при точности (precision) 5.5%, что на 37% выше, чем у классической нейросети. Эффективность квантовой интеллектуальной системы заключается в том, что она может обучаться онлайн и позволяет производить до-обучение, всегда стремясь к улучшению качества классификации. Системы такой архитектуры можно применять и в других случаях, где несбалансированность данных затрудняет использование классического машинного обучения и известные алгоритмы оверсемплинга не помогают справиться с задачей.
КЛЮЧЕВЫЕ СЛОВА: квантовое машинное обучение, квантовая нейронная сеть, инцидент информационной безопасности, несбалансированные обучающие выборки, несбалансированные данные.