М. В. Зингеренко
Малобитные квантованные нейронные сети в системе остаточных классов с классическим или усредняющим накоплением
Для решения задач компьютерного зрения на устройствах с ограниченными ресурсами применяются малобитные равномерно квантованные нейросети, сохраняющие высокую точность при простой аппаратной реализации на центральных процессорах. В работе предложена модель вычисления равномерно квантованных нейронных сетей в системе остаточных классов, обеспечивающей параллельную аппаратно-эффективную арифметику без переносов и предназначенной для программируемых логических интегральных схем и специализированных устройств. Представлены модели всех основных слоев: линейных, сверточных, кусочно-линейных активаций и реквантование. Выполнена оценка разрядности аккумуляторов и выбор наборов модулей, гарантирующих отсутствие переполнения. Для повышения эффективности аппаратной реализации линейных слоев предложено использовать усредняющее накопление, которое позволяет уменьшить требуемую разрядность аккумулятора.
КЛЮЧЕВЫЕ СЛОВА: равномерное малобитное квантование, сверточные нейронные сети, система остаточных классов, энергоэффективность.