Автоматизированная система построения нейронной сети методом обратного распространения ошибки

Багаутдинов Руслан Ринатович

магистр

РТ, г. Казань, КНИТУ-КХТИ

Кафедра "Информатики и прикладной математики"

Нуриев Наиль Кашапович, профессор, доктор педагогических наук, заведующий кафедрой - Кафедра

Аннотация:

На сегодняшний день нейронные сети открывают широкие возможности для построения информационных систем. Текущие достижения показывают, что эта технология развивается с каждым годом. Для усовершенствования построения нейросетей применяются различные методы и алгоритмы, которые позволяют повысить интеллектуальность разрабатываемых машин.

Abstract:

Today neural networks offer great opportunities to build information systems. Current achievements show that this technology is developing every year. To improve the construction of neural networks, various methods and algorithms are used, which allow to increase the intelligence of the developed machines.

Ключевые слова:

нейронные сети; автоматизация; обратное распространение ошибки

Keywords:

neural networks; automation; back-propagation

УДК 004

В наши дни трудно представить такую сферу деятельности, в которой бы не применялись различные интеллектуальные приспособления, которые значительно облегчают работу и серьезно влияют на ход жизнедеятельности. Среди таких сфер – медицина, наука, образование, бизнес, развлечения и т.д.

Одним из наиболее распространенных применений нейросетей является обработка изображений. Это идентификация рукописных символов; сопоставление фотографии лица человека с другой фотографией в базе данных; выполнение сжатия данных на изображении с минимальной потерей содержимого. Метод же, рассматриваемый в статье, появился задолго до практической необходимости классифицировать и распозновать изображения.
Исследователи были заинтересованы в том, чтобы найти способ обучения многослойных искусственных нейронных сетей, которые могли бы автоматически обнаружить хорошие "внутренние представления", то есть функции, которые делают обучение более легким и точным. Пространственные объекты могут рассматриваться как стереотипные входные данные для определенного узла, который активирует этот узел (т. е. заставляет его выводить положительное значение около 1). Поскольку активация узла зависит от его входящих весов и смещения, исследователи говорят, что узел изучил объект, если его вес и смещение вызывают активацию этого узла, когда объект присутствует во входных данных. Метод обратного распространения ошибки был одним из первых методов, способных продемонстрировать, что искусственные нейронные сети могут воспринимать "хорошие" внутренние данные. Специалисты, исследуя многослойные сети прямого распространения, на самом деле обнаружили, что многие узлы сходны с теми, которые разработаны экспертами и нейробиологами, при исследовании биологических нейронных сетей в мозге млекопитающих (например, некоторые узлы научились обнаруживать края, в то время как другие использовали фильтры Габора). Еще более важно то, что из-за эффективности алгоритма и того факта, что экспертам по предметам больше не требовалось обнаруживать соответствующие функции, метод обратного распространения ошибки позволил применять искусственные нейронные сети к гораздо более широкому кругу проблем, которые ранее были недоступны из-за ограничений по времени и затратам.

Если рассматривать человеческий мозг как "конечную" нейронную сеть, то в идеале необходимо создать устройство, имитирующее функции мозга. Однако, из-за пределов даже в сегодняшних технологиях, приходиться использовать упрощенную конструкцию. Очевидный подход заключается в разработке небольшого электронного устройства, которое имеет передаточную функцию, аналогичную биологическому нейрону, а затем соединяет каждый нейрон со многими другими нейронами, используя сети RLC для имитации дендритов, аксонов и синапсов. Этот тип электронной модели все еще довольно сложен для реализации, и могут возникнуть трудности с "обучением" сети, а также с применением ее в практических целях. Необходимы дополнительные ограничения, чтобы сделать проект более управляемым. Связь между нейронами изменяется так, что они находятся в разных слоях, так что каждый нейрон в одном слое связан с каждым нейроном в следующем слое. Далее, определяется, что сигналы текут только в одном направлении по сети, и упрощается конструкция нейрона и синапса, чтобы они вели себя как аналоговые компараторы, управляемые другими нейронами через простые резисторы. Теперь у нас есть модель нейронной сети, которая может быть практичной для построения и использования.

Поскольку реальная уникальность или "интеллект" сети существует в значениях весов между нейронами, нам нужен метод корректировки весов для решения конкретной проблемы. Для этого типа сети наиболее распространенный алгоритм обучения называется методом обратного распространения ошибки. Сеть учится на примере, то есть необходимо предоставить обучающий набор, который состоит из некоторых входных примеров и известных правильных выходных данных для каждого случая. Таким образом, мы используем эти примеры ввода-вывода, чтобы показать сети, какой тип поведения ожидается, и алгоритм позволяет сети адаптироваться. Процесс обучения с применением метода обратного распространения ошибки (рис.1) происходит небольшими итеративными шагами: один из примеров применяется к сети, и сеть производит некоторые выходные данные на основе текущего состояния ее синоптических весов (первоначально выходные данные будут случайными). Результат сравнивается с “хорошими” выходными данными и высчитывается средний сигнал ошибки. Значение ошибки затем распространяется назад по сети, и небольшие изменения вносятся в веса в каждом слое. Весь процесс повторяется для каждого из примеров, затем снова возвращается к первому случаю и так далее. Цикл повторяется до тех пор, пока общее значение ошибки не опустится ниже определенного порога. В этот момент делается вывод, что сеть изучила проблему "достаточно хорошо". При всем этом сеть никогда точно не изучит идеальную функцию, а скорее асимптотически приблизится к идеальной функции.

Рисунок 1- Обучение сети с применением метода обратного распространения ошибки

При этом, если обучение сети может являться довольно длительным процессом, то непосредственное вычисление результатов обученной сетью происходит очень быстро. Кроме того, существуют многочисленные вариации метода обратного распространения ошибки, разработанные с целью увеличения скорости протекания процесса обучения.

Нейронная сеть обратного распространения практична только в определенных ситуациях. Ниже приведены некоторые рекомендации о том, когда следует использовать данный метод:

Легко создать ряд примеров правильного поведения.
Решение задачи может меняться со временем, в пределах заданных входных и выходных параметров.
Проблема, как представляется, имеет подавляющую сложность, но решение явно существует.

Важно помнить, что при решении задачи с использованием нейронных сетей, не важно полностью понимать смысл решения. Это является основным преимуществом подходов нейросетей. При достаточном объеме обучения сеть будет имитировать демонстрируемую функцию. Кроме того, с помощью нейронных сетей можно применить некоторые входы, которые оказываются неуместными для решения - в процессе обучения сеть научится игнорировать любые входы, которые не способствуют выходу.

Библиографический список:

1. Венедиктов В.Е. Нейронные сети: распознавание образов. - издательство "Финансы и статистика" - 2008 г. - 106 стр.
2. Трикоз Д. В. Нейронные сети: как это делается? // Компьютеры + программы - 1993 - N 4(5) с. 10-26.
3. Невельсон Е. Методы обучения нейронных сетей. // В мире науки - 2000г - N 11 - N 12 - c. 98-127.

Рецензии:

24.05.2018, 16:23 Феофанов Александр Николаевич
Рецензия: Рецензия на статью Бегаутдинова Р.Р. «Автоматизированная система построения нейронной сети методом обратного распространения ошибки» Статья носит компилятивный характер. В ней повторяются идеи и алгоритмы, которые предложены Полем Дж. Вербосом и А.И.Галушкиным в 1974г. За это продолжительное время в печати было представлено на эту тему большое количество публикаций. С точки зрения научной новизны, в статье она отсутствует. С прикладной точки зрения в статье отсутствуют материалы использования рассматриваемого метода к конкретным объектам исследования. С точки зрения представления материала, название и аннотация не отражают содержание работы. В работе отсутствует заключение. Учитывая представленные выше замечания, считаю, что представленная статья не может быть рекомендована к публикации. Рецензент Д.т.н., проф. ФГБОУ ВО «МГТУ «Станкин» Феофанов А.Н.

26.05.2018, 9:01 Поплавская Лидия Андреевна
Рецензия: Статья носит обзорный характер, научная новизна отсутствует. Дается некоторый обзор одного из направлений, в которых на данный момент развиваются нейронные сети, используя устаревшие источники. Не указываются сферы деятельности, где они уже активно применяются и не рассматриваются возможности, которые данные сети открывают в будущем. А ведь искусственные нейронные сети уже прочно вошли в нашу жизнь и в настоящее время широко используются при решении самых разных задач, причем, активно применяются именно там, где обычные алгоритмические решения оказываются неэффективными или вовсе невозможными. К числу задач, решение которых доверяют искусственным нейронным сетям, можно отнести распознавание текстов и речи, семантический поиск, экспертные системы и системы поддержки принятия решений, игра на бирже (предсказание курсов акций), контекстная реклама в Интернете, фильтрация спама, проверка проведения подозрительных операций по банковским картам, системы безопасности и видеонаблюдения, и это далеко не весь перечень, о чем автору следовало бы изложить в своей статье. Еще в 70-х годах в научных журналах появлялись публикации, касающиеся искусственных нейронных сетей. Постепенно был сформирован хороший теоретический фундамент, на основе которого сегодня создается большинство сетей. А в последние два десятилетия разработанная теория стала активно применяться для решения прикладных задач. Активно функционируют фирмы, занимающиеся разработкой прикладного программного обеспечения для конструирования искусственных нейронных сетей (еще в 90-е годы искусственные нейронные сети пришли в бизнес, где они показали свою реальную эффективность при решении многих задач — от предсказания спроса на продукцию до анализа платежеспособности клиентов банка). А на сегодня существует большое число различных конфигураций нейронных сетей с различными принципами функционирования, которые ориентированы на решение самых разных задач. Тем не менее, автор ссылается на значительно устаревшие источники информации. Автором не указаны недостатки применения нейронных сетей. А ведь при их применении там, где на карту поставлены человеческие жизни или значительные материальные ресурсы, должны быть решены важные вопросы, касающиеся надежности их работы. При решении таких задач нейронные сети должны выступать не в качестве единственных средств, а в качестве дополнительных, предупреждающих особые ситуации или берущих на себя управление, когда проблема не решается стандартным образом и какие-либо задержки могут привести к катастрофе. Между тем, нейронные сети уверенно продолжают проникать в нашу жизнь, и примеров тому немало. Продемонстрировали свою способность решать сложные задачи, имеют уникальные потенциальные возможности, хотя и не свободны от ограничений и вопросов, на которые до сих пор не существует ответа и которые следовало бы указать автору статьи. Автором не проработан достаточно глубоко материал по данному направлению и нейронные сети изложены им как панацея. А ведь это всего лишь дополнительный функционал для решения тех или иных задач. Их работа напоминает черный ящик. И самым сложным и трудоемким процессом при этом является их обучение решать ту или иную задачу. Считаю, что статья может быть опубликована только при условии ее доработки в соответствии с современным наработанным теоретическим фундаментом. Рецензент - к.ф.-м.н, доцент Поплавская Л.А.

5.12.2018, 13:26 Сулейманова Лилия Ирфановна
Рецензия: В рецензируемой работе рассмотрена автоматизированная система построения нейронной сети методом обратного распространения ошибки. К рецензируемой работе имеются следующие замечания: - статья носит описательный характер, что недопустимо для научного журнала; - в статье отсутствуют материалы использования рассматриваемого метода к конкретным объектам исследования; - автор ссылается на значительно устаревшие источники информации; - автор не привел ни цель написания статьи, ни задачи, которые он ставил при ее написании, отсутствуют выводы. Поскольку в названии статьи заявлена разработка программы обработки изображений, необходимо ее описать, показать ее новизну, достоинства, сравнить с существующими программами, привести алгоритмы работы программы; -из статьи не видно значимости проделанной работы. Вывод: рецензируемая работа может быть рекомендована к опубликованию только после глубокой переработки. К.т.н., Сулейманова Л.И.

Комментарии пользователей:

Оставить комментарий

E-mail: sci@sci-article.ru
©2013-2023 Электронный периодический научный журнал SCI-ARTICLE.RU
Любое использование размещённых на сайте журнала статей и материалов возможно только с обязательной активной ссылкой на сайт журнала «SCI-ARTICLE.RU».

▲
Вверх

E-mail:
Пароль:
Запомнить
	Регистрация/ Забыли пароль?