Публикация научных статей.
Вход на сайт
E-mail:
Пароль:
Запомнить
Регистрация/
Забыли пароль?

Научные направления

Поделиться:
Разделы: Информационные технологии
Размещена 15.05.2025. Последняя правка: 07.05.2025.
Просмотров - 326

Разработка программного модуля автоматической классификации заявок с использованием нейросетевых моделей

Хомченко Владислав Евгеньевич

-

«Уфимский государственный нефтяной технический университет» (ФГБОУ ВО УГНТУ) Институт нефтепереработки и нефтехимии ФГБОУ ВО УГНТУ в г. Салавате

Студент

Гаврилов Станислав Витальевич, кафедра Информационных технологий, Уфимский государственный нефтяной технический университет, Институт нефтепереработки и нефтехимии ФГБОУ ВО УГНТУ в г. Салавате


Аннотация:
В статье рассматривается разработка программного модуля для автоматической классификации входящих заявок с использованием нейросетевых технологий. Предложенное решение основано на архитектуре Bidirectional LSTM, обеспечивающей высокую точность распознавания категорий заявок. Описаны методы предобработки текстовых данных, особенности обучения модели и интеграции системы с Telegram-ботом и графическим интерфейсом администратора.


Abstract:
The article presents the development of a software module for automatic classification of incoming requests using neural network technologies. The proposed solution is based on Bidirectional LSTM architecture, which provides high accuracy in request category recognition. The methods of text data preprocessing, model training features, and system integration with Telegram bot and administrator GUI are described.


Ключевые слова:
классификация текстов; нейронные сети; LSTM; обработка естественного языка; автоматизация бизнес-процессов; Telegram-бот; машинное обучение

Keywords:
text classification; neural networks; LSTM; natural language processing; business process automation; Telegram-bot; machine learning


УДК 004.8

Введение
Современные организации сталкиваются с необходимостью обработки большого количества входящих заявок, что требует значительных временных и трудовых затрат. Автоматизация этого процесса с использованием технологий искусственного интеллекта позволяет существенно повысить эффективность работы служб поддержки. Современные технологии машинного обучения и нейронных сетей предоставляют новые возможности для автоматической классификации текстовых данных. Применение таких технологий в данной области является перспективным, так как значительно помогает ускорить и упростить процесс обработки данных, повышая качество обслуживания [1].

В данной статье рассматривается разработка системы автоматической классификации заявок на основе нейросетевых технологий, интегрированной с Telegram-ботом для взаимодействия с пользователями.

Актуальность
Ручная обработка входящих запросов становится все менее эффективной по мере роста их объема. Традиционные методы фильтрации, основанные на ключевых словах, не справляются с разнообразием формулировок и постоянно меняющимися паттернами спама. Нейросетевые подходы, особенно модели, учитывающие контекст сообщений, демонстрируют значительно лучшие результаты в задачах классификации текста. Разработанное решение актуально для различных сфер, включая электронную коммерцию, финансовые услуги и государственные учреждения. В компаниях, которые получают большое количество входящих заявок, так как ручная проверка каждого запроса становится трудоемкой и затратной [2]. Автоматизация процесса поступающих обращений позволяет значительно сократить время обработки заявок и минимизировать количество ошибок.

Цели и задачи
Основной целью исследования являлась разработка системы автоматической классификации, для повышения качества и эффективности обработки заявок за счет разработки программного модуля с использованием машинного обучения.

Для достижения данной цели были решены следующие задачи:
- подготовка и сбор данных для обучения;
- выбор оптимальной архитектуры нейронной сети;
- разработка программного модуля и его интеграция в систему обработки заявок.

В работе использовались следующие технологии:

- python как основной язык программирования;
- tensorFlow и Keras для построения нейросетевой модели;

- библиотеки Pandas и NumPy для обработки данных;

- telegram Bot API для взаимодействия с пользователями;

- pyQt5 для создания графического интерфейса администратора.

Модель основана на архитектуре Bidirectional LSTM с дополнительными слоями Dropout для предотвращения переобучения [3]. Особенностью подхода является комбинация темы и текста сообщения для улучшения качества классификации.

Научная новизна работы заключается в разработке специализированной архитектуры нейронной сети, оптимизированной для обработки русскоязычных заявок. Предложенный метод комбинированного анализа темы и текста сообщения позволяет достичь более высокой точности по сравнению с традиционными подходами. Особое внимание уделено механизмам интеграции нейросетевого классификатора с мессенджером Telegram и desktop-приложением для администратора.

Нейросетевые модели, в частности двунаправленные LSTM, продемонстрировали высокую эффективность в задачах классификации и маршрутизации клиентских заявок [4]. В рамках исследования была разработана модель, которая анализирует текст заявок, включая тему и содержание, и определяет их принадлежность к одному из отделов: продажи, сопровождения, техническая поддержка или спам.

Ключевые преимущества нейросетевых моделей в данной задаче:
- для понимания смысла текста, LSTM-слои позволяют учитываться последовательно слов;
- модель адаптируется к изменениям в структуре заявок и появлению новых паттернов спама;
- снижается нагрузка на сотрудников за счет автоматической классификации и маршрутизации заявок.

Эффективность модели зависит от качества данных для обучения и предобработки текста. Внедрение механизмов автоматического дообучения и расширение датасета могут ещё больше повысить точность классификации.

Методы машинного обучения, такие как нейронные сети и алгоритмы векторизации текста, успешно применяются для предсказания результатов обработки заявок.

В исследовании использовались следующие подходы:
- токензиация и паддинг, предназначенные для преобразования текста в числовые последовательности для анализа;
- векторизация и эмбеддинг, для оценки важности слов и их семантического значения;
- двунаправленные LSTM, позволяющие проводить анализ текста в прямом и обратном порядке для улучшения понимания контекста [5].

Перечисленные методы позволили не только классифицировать заявки, но и прогнозировать их дальнейшую обработку по определению приоритетов, фильтрации спама, оптимизации времени обработки.

Разработанный модуль объединяет Telegram-бота, нейросетевой классификатор и интерфейс администратора в единую систему. На рисунке 1 представлен пример сбора ботом данных пользователей, которые классифицируются моделью на основе LSTM и направляются в соответствующие разделы интерфейса, представленного на рисунке 2.

Ядро системы – нейросетевой классификатор, он интегрируется непосредственно в графическое приложение, позволяя обрабатывать поступающие сообщения в реальном времени. При получении нового обращения бот через callback-функцию передает данные в главное окно приложения, где происходит их классификация и распределение по соответствующим разделам интерфейса. Особенностью реализации стало использование механизма сигналов и слотов PyQt5 для обеспечения потокобезопасности при обновлении интерфейса из фонового потока бота.

Рисунок 1. Пример диалога пользователя с ботом в телеграмм

При выборе конкретного обращения администратор получает полную информацию: время поступления, контактные данные пользователя и текст сообщения. Такая организация позволяет администратору быстро ориентироваться в потоке входящих запросов.

Рисунок 2. Пример работы программы

Важным аспектом интеграции является организация хранения и доступа к данным модели. Система предусматривает два режима работы: с предварительно обученной моделью, загружаемой из папки model_data и с возможностью повторного обучения на новых данных. Такой подход обеспечивает гибкость при эксплуатации системы и позволяет адаптировать классификатор под изменяющиеся условия.

Результатом выполненной работы стало создание целостной системы, где все компоненты работают согласованно, обеспечивая полный цикл обработки заявки от момента обращения пользователя в Telegram до появления классифицированного запроса в интерфейсе администратора.

Перспективным направлением является внедрение анализа тональности текста для определения срочности заявок и интеграция с системами аналитики для прогнозирования нагрузки на отделы. Такой подход позволит ещё больше оптимизировать бизнес-процессы и улучшить качество обслуживания клиентов.

Методы машинного обучения показывают свою эффективность в автоматизации обработки заявок, обеспечивая высокую точность, скорость и адаптивность к изменениям.

Заключение
Разработанное решение открывает новые возможности для автоматизации процессов обработки обращений в различных организациях, способствуя повышению эффективности работы служб поддержки и улучшению качества обслуживания клиентов. Модульный принцип построения системы и использование современных технологий машинного обучения создают прочную основу для дальнейшего развития и адаптации под конкретные бизнес-задачи.

Основные преимущества решения включают:
- снижение нагрузки на операторов;
- уменьшение времени обработки заявок;
- возможность адаптации под специфику различных организаций.

Разработанный модуль обладает значительным потенциалом для применения в различных сферах деятельности, где требуется автоматизация обработки текстовых обращений. Гибкость архитектуры позволяет адаптировать решение под специфические требования конкретных организаций, включая возможность добавления новых категорий классификации и интеграции с различными системами документооборота.

Перспективы дальнейшего развития системы включают внедрение механизмов автоматического дообучения на новых данных, добавление анализа эмоциональной окраски сообщений и расширение функциональности для работы с мультиязычными запросами.

Библиографический список:

1. Агравал А. Автоматизация предприятия с помощью Python / А. Агравал. - СПб.: Питер, 2022. - 203 с.
2. Кравченко В.О. Методы использования искусственных нейронных сетей / В.О. Кравченко // Устойчивое развитие науки и образования. - 2018. - С. 266.
3. Джулли А., Пал С. Библиотека Keras - инструмент глубокого обучения / А. Джулли, С. Пал; пер. с англ. - М.: ДМК Пресс, 2018. - 296 с.
4. Учебник по обработке естественного языка [Электронный ресурс]. - URL: https://isolution.pro/ru/t/natural-language-processing?alias=ucebnik-po-obrabotke-estestvennogo-azyka (дата обращения 06.05.2025)
5. Отькало И.И. Автоматизация бизнес-процессов: практическое руководство / И.И. Отькало. - М.: СПб.: Питер 2019. - 480 с.




Комментарии пользователей:

Оставить комментарий


 
 

Вверх