В. С. Мошкин, З. Г. Казбекова, И. Е. Калабихина, М. И. Кашин

Выбор и настройка больших языковых моделей для классификации текстов в социальных сетях

В статье рассматривается задача классификации текстов в социальных сетях с использованием больших языковых моделей (LLM). Исследуются различные методы классификации, включая традиционные модели, такие как CNN, LSTM и GRU, а также современные подходы, основанные на применении LLM. Уделяется внимание проблемам дисбаланса классов в наборах данных, а также способам их решения, включая метод SMOTE и генерацию/классификацию данных на основе LLM. В рамках исследования проводится анализ влияния различных параметров модели на эффективность процесса классификации текстов. Дополнительно представлены результаты экспериментальной работы по классификации текстовых данных, извлечённых из комментариев к тематическим видео русскоязычного YouTube, при этом критерием классификации являлось наличие в тексте мотивации бросать или не бросать курить.

КЛЮЧЕВЫЕ СЛОВА: классификация текстов, нейронные сети, модели LLM, генерация данных, LSTM, GRU, CNN, SMOTE, балансировка данных.