Публикация научных статей.
Вход на сайт
E-mail:
Пароль:
Запомнить
Регистрация/
Забыли пароль?

Научные направления

Поделиться:
Статья опубликована в №119 (июль) 2023
Разделы: Информационные технологии
Размещена 13.07.2023. Последняя правка: 13.07.2023.
Просмотров - 715

ИССЛЕДОВАНИЕ ПРАКТИЧЕСКОГО ПРИМЕНЕНИЯ НЕЙРОННЫХ СЕТЕЙ ДЛЯ РАСПОЗНАВАНИЯ РУКОПИСНОГО ТЕКСТА

Вовк Надежда Юрьевна

Бакалавр

ФГБОУ ВО «Тюменский индустриальный университет»

Студент

Ахмадулин Руслан Камильевич, кандидат технических наук, доцент кафедры кибернетических систем ФГБОУ ВО «Тюменский индустриальный университет»


Аннотация:
В данной статье исследуется практическое применение нейронных сетей для распознавания рукописного текста. Распознавание рукописного текста имеет широкий спектр применений в различных областях, и эффективные алгоритмы в этой области являются важным исследовательским направлением. Статья предоставляет обзор существующих методов распознавания рукописного текста, вводит в нейронные сети и их преимущества для этой задачи. Описываются методы и подходы к использованию нейронных сетей для распознавания рукописного текста, приводятся примеры успешного применения и обсуждаются вызовы и перспективы развития в данной области.


Abstract:
This article explores the practical application of neural networks for handwriting recognition. Handwriting recognition has a wide range of applications in various fields, and efficient algorithms in this area are an important research area. The article provides an overview of existing handwriting recognition methods, introduces neural networks and their advantages for this task. Methods and approaches to the use of neural networks for handwriting recognition are described, examples of successful application are given, and challenges and prospects for development in this area are discussed.


Ключевые слова:
распознавание рукописного текста; нейронные сети; обработка естественного языка; компьютерное зрение; методы распознавания; архитектуры нейронных сетей; предварительная обработка данных; обучение с учителем; вызовы и перспективы развития

Keywords:
handwriting recognition; neural networks; natural language processing; computer vision; recognition methods; neural network architectures; data preprocessing; teacher training; challenges and development prospects


УДК 004.896

Введение. Распознавание рукописного текста является одной из важных задач в области компьютерного зрения и обработки естественного языка. Оно имеет широкий спектр применений, включая автоматическое сортирование почты, распознавание рукописных банковских чеков, распознавание адресов в системах доставки, медицинскую документацию и многое другое. Однако, из-за сложностей, связанных с вариативностью рукописного почерка, разработка эффективных алгоритмов для распознавания рукописного текста остается актуальной задачей.

Актуальность. Распознавание рукописного текста остается актуальной задачей в области компьютерного зрения и обработки естественного языка. С ростом числа приложений и систем, требующих распознавания рукописного текста, разработка эффективных алгоритмов становится необходимостью. Применение нейронных сетей для этой задачи предлагает новый подход, который может преодолеть ограничения традиционных методов и достичь высокой точности распознавания. Эта статья имеет актуальность для исследователей и практиков, которые заинтересованы в применении нейронных сетей в распознавании рукописного текста.

Цели, задачи, материалы и методы. Целью данной статьи является исследование практического применения нейронных сетей для распознавания рукописного текста. Для достижения этой цели ставятся следующие задачи: обзор существующих методов распознавания рукописного текста, изучение принципов работы нейронных сетей, анализ методов и подходов к использованию нейронных сетей для распознавания рукописного текста, исследование успешных примеров применения и обсуждение вызовов и перспектив развития в этой области.

Материалы и методы исследования включают в себя анализ литературы и научных статей, посвященных распознаванию рукописного текста и применению нейронных сетей. Были изучены различные подходы и методы, а также проведен анализ успешных примеров применения нейронных сетей в распознавании рукописного текста. Этот анализ служит основой для формулировки выводов и рекомендаций в статье.

Научная новизна данной статьи заключается в исследовании и анализе практического применения нейронных сетей для распознавания рукописного текста. В статье представлен обзор существующих методов распознавания, введение в нейронные сети и их преимущества, описание методов и подходов к использованию нейронных сетей для этой задачи, а также приведены успешные примеры применения и обсуждаются вызовы и перспективы развития. Это исследование объединяет и систематизирует информацию о применении нейронных сетей в распознавании рукописного текста и предоставляет новый взгляд на эту область.

Машинное обучение - это сложная дисциплина, которая изучает, как использовать машину для осуществления человеческой деятельности. Это новое знание, приобретенное машиной, и оно используется для выявления существующих знаний и оптимизации стандарта производительности компьютерной программы. Как ветвь машинного обучения, глубокое обучение - это более сложный алгоритм машинного обучения [1, с. 307]. Он достиг определенных результатов в распознавании изображений и речи. Глубокое обучение рассматривается как передовая и новаторская технология. Глубокое обучение добилось значительного прогресса в области персонализированных технологий, голосовой связи, обработки естественного языка, машинного перевода, мультимедийного обучения, машинного обучения, интеллектуального анализа данных, поисковых технологий и многих других аспектов. Благодаря глубокому обучению машины могут имитировать человеческую деятельность, такую как мыслительная деятельность и аудиовизуальная деятельность, по существу решает сложную проблему распознавания образов, технология искусственного интеллекта в определенной степени, прогресс исследований и практическое применение глубокого обучения органично является неотъемлемой частью работы. Кроме того, распознавание символов является наиболее важной частью процесса распознавания образов. Распознавание символов включает в себя не только распознавание образов, но и логику, обработку изображений, когнитивные способности и так далее. С развитием технологий технология распознавания символов быстро меняется. Скорость распознавания также улучшается. И он широко использовался при написании иероглифов. Однако простое распознавание символов может иметь очень высокую скорость распознавания, сложное распознавание символов сопряжено с большими трудностями, это связано с тем, что если персонаж находится в сложной среде, такой как природная среда, то его фон расплывчатый, разрешение относительно низкое, в тусклой сцене интенсивность освещения недостаточна и т.д.

Исторически, первые подходы к распознаванию рукописного текста основывались на математических моделях и статистических алгоритмах. Они включали в себя методы, основанные на шаблонах и классификации признаков. Однако, эти традиционные методы имели свои ограничения и проблемы, такие как высокая степень ошибок при распознавании и сложности в обработке различных стилей и вариаций рукописного почерка. Нейронные сети представляют собой мощный инструмент в области машинного обучения, который имитирует работу человеческого мозга [2, с. 5914]. Они состоят из множества взаимосвязанных нейронов, которые обрабатывают информацию и выполняют задачи, такие как классификация и распознавание образов. Различные архитектуры нейронных сетей, такие как сверточные нейронные сети и рекуррентные нейронные сети, могут быть применены для распознавания рукописного текста.

Для успешного распознавания рукописного текста с помощью нейронных сетей требуется предварительная обработка данных, такая как нормализация и фильтрация. Затем нейронные сети обучаются на размеченных данных, чтобы определить связи между входными образами и соответствующими символами. Различные архитектуры нейронных сетей, специально оптимизированные для распознавания рукописного текста, могут быть применены для улучшения точности и скорости распознавания. Как типичная модель сверточной нейронной сети, модель LeNet-5 обладает очень хорошим эффектом при распознавании рукописных символов. Далее мы подробно представим модель LeNet-5. Всего поперечный узор состоит из семи слоев, из которых входное изображение составляет 32*32 пикселя. Второй слой C1, всего шесть карт, потому что из входного слоя из поля размера 5*5 в качестве входных данных, свертка, конкретные объекты могут быть извлечены с помощью входной свертки, размер карты объектов слоя равен 28*28, а параметры слоя 156 соответствуют 6 из них. Карта объектов, каждая из которых включает в себя 25 параметров, смещение параметров. Третий слой - это слой извлечения объектов S2. Роль этого слоя заключается в сохранении некоторой полезной информации. С другой стороны, это может уменьшить объем данных, и выбор объектов для извлечения должен быть умеренным, а не большим или меньшим. Если он слишком велик, вы потеряете нужную вам информацию, а если он слишком мал, то эффекта не будет достигнуто. Слой содержит 6 карт объектов, поскольку размер карты объектов уменьшен на 3/4 по сравнению с предыдущей, и осталась только 1/4 (14*14). Кроме того, в слое есть 12 параметров и 5880 подключений. Затем слой извлечения объектов переходит к слою свертки C3, который является таким же, как и предыдущий слой свертки. С верхнего уровня в качестве входных данных берется поле размером 5*5, а размер всех объектов на этом слое равен 10*10. Из-за увеличения ядра свертки карта объектов этого слоя изменилась с первоначальных 6 на 16.Стоит отметить, что объекты, извлеченные из процесса перехода от слоя к слою, не соответствуют друг другу, поэтому нет необходимости вводить слой извлечения объектов в граф объектов со слоем соединения. С помощью этого метода можно заставить граф объектов изучать различные объекты и сделать сеть несимметричной.

Существуют многочисленные примеры успешного применения нейронных сетей для распознавания рукописного текста. Например, исследователи разработали алгоритмы, которые показали высокую точность распознавания рукописного текста на различных датасетах. Эти методы применяются в различных областях, включая банковское дело, почтовые службы и медицину [3, с. 258]. Нейронные сети также позволяют справляться с изменчивостью и различными стилями рукописи, что делает их эффективным инструментом для распознавания рукописного текста. Несмотря на значительные успехи в применении нейронных сетей для распознавания рукописного текста, остаются некоторые вызовы [4, с. 22]. Один из них - это работа с недостаточными или шумными данными, а также с большими объемами данных, требующими большой вычислительной мощности [5, с. 55]. Однако, с развитием технологий и доступностью больших объемов размеченных данных, нейронные сети могут стать еще более точными и эффективными в распознавании рукописного текста.

Заключение. Исследование практического применения нейронных сетей для распознавания рукописного текста показывает потенциал этой технологии в различных сферах. Нейронные сети предлагают эффективные методы для распознавания рукописного текста, преодолевая ограничения традиционных подходов. Следует отметить, что совершенствование алгоритмов и увеличение объема доступных данных будут способствовать дальнейшему развитию и применению нейронных сетей в этой области.  Одним из ключевых направлений развития является улучшение архитектур нейронных сетей, чтобы достичь еще более высокой точности распознавания рукописного текста. Исследователи работают над созданием более глубоких и сложных нейронных сетей, которые способны улавливать более тонкие детали и контекст информации в рукописном тексте. Применение сверточных нейронных сетей, которые хорошо работают с изображениями, и рекуррентных нейронных сетей, способных учитывать последовательность символов, также показывает хорошие результаты.

Другой важной областью исследования является предварительная обработка данных. Разработка эффективных методов нормализации, фильтрации и препроцессинга помогает улучшить качество данных, что в свою очередь положительно сказывается на процессе распознавания. Также стоит упомянуть использование аугментации данных, которая позволяет создавать больше разнообразных примеров рукописного текста для обучения нейронных сетей и повышает их устойчивость к вариациям стилей письма. Большое значение имеет также создание больших и разнообразных датасетов рукописного текста для обучения нейронных сетей. Сбор и разметка подобных данных являются сложной и трудоемкой задачей, но наличие качественных данных является важным фактором для достижения высокой точности распознавания. Развитие методов сбора и разметки данных, а также сотрудничество между исследователями и организациями, владеющими большими объемами данных, способствуют развитию этой области.

Одним из вызовов, с которым сталкиваются исследователи и практики, является необходимость работать с реальными условиями и различными стилями рукописи. В реальных ситуациях рукописный текст может быть искажен, иметь разные размеры и ориентацию, а также содержать помехи и шум. Развитие методов, способных работать с такими условиями, является одним из направлений будущих исследований.

В заключение, исследование практического применения нейронных сетей для распознавания рукописного текста является важным и актуальным направлением. Нейронные сети предлагают мощный инструмент для достижения высокой точности в распознавании, исключая ограничения традиционных методов. С постоянным совершенствованием алгоритмов, увеличением доступных данных и применением передовых техник предварительной обработки, нейронные сети имеют потенциал для революционного улучшения процесса распознавания рукописного текста и его практического применения в различных областях.

Библиографический список:

1. Кирьяков М. А. СРАВНИТЕЛЬНОЕ ИССЛЕДОВАНИЕ МЕТОДОВ РАСПОЗНАВАНИЯ РУКОПИСНОГО ТЕКСТА НА ОСНОВЕ ГИБРИДНЫХ НЕЙРОННЫХ СЕТЕЙ // Труды международного симпозиума" Надежность и качество". – 2020. – Т. 1. – С. 307-309.
2. Морозов А. А. ИССЛЕДОВАНИЕ НЕЙРОННЫХ СИСТЕМ ДЛЯ РАСПОЗНАВАНИЯ ТЕКСТОВЫХ ИЗОБРАЖЕНИЙ // StudNet. – 2022. – Т. 5. – №. 6. – С. 5912-5920.
3. Жукова Т. В. Применение нейросетевой технологии в прикладных исследованиях // ТОГУ-СТАРТ: ФУНДАМЕНТАЛЬНЫЕ И ПРИКЛАДНЫЕ ИССЛЕДОВАНИЯ МОЛОДЫХ. – 2021. – С. 257-261.
4. Самылкина Н. Н., Калинин И. А. Изучение работы нейронной сети на примере распознавания рукописных цифр с использованием языка программирования Python 3.8 в углубленном курсе информатики // Информатика в школе. – 2021. – №. 10. – С. 21-29.
5. Буркин О. М. ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ //ТЕОРЕТИЧЕСКИЕ И ПРАКТИЧЕСКИЕ АСПЕКТЫ НАУЧНЫХ ИССЛЕДОВАНИЙ. – 2019. – С. 54-57.




Рецензии:

15.07.2023, 14:47 Мирзаев Номаз Мирзаевич
Рецензия: На сегодняшний день одним из актуальных направлений в области информатики и информационных технологий является вопросы распознавания рукописного текста. Проблема распознавания рукописного текста находится в центре внимание достаточно широкого круга специалистов. Она состоит, в основном, из следующих задач: 1) offline-распознавания рукописного текста (по изображению текста); 2) online-распознавания рукописного текста (по следу пера). В рецензируемой работе рассмотрено offline-распознавания в общем виде, которое не имеет приемлемого решения в настоящее время. Это показывает актуальность темы исследования данной работы. Поэтому его можно рекомендовать к публикации. Желательно, чтобы авторы улучшили хотя бы обзорную часть в окончательном варианте, т.к. анализ существующих методов не делается на основе обзора всего 5 источников.



Комментарии пользователей:

Оставить комментарий


 
 

Вверх