Академия управления при Президенте Республики Беларусь
Студент
Белодед Николай Иванович, кандидат технических наук, профессор, кафедра управления информационными ресурсами, Академия управления при Президенте Республики Беларусь
УДК 004
Целью настоящего исследования было определение актуального уровеня осведомленности о технологиях машинного обучения и искусственного интеллекта среди жителей Беларуси.
Задачи:
1. Изучить теоретические аспекты в области искусственного интеллекта и машинного обучения.
2. Ознакомиться с устройством, принципами, компонентами, методами и алгоритмами работы машинного обучения.
3. Провести анкетирование для оценки уровня информированности населения о технологиях в данной области.
Объект исследования: технологии искусственного интеллекта и машинное обучение. Предмет исследования: уровень информированности общества о машинном обучение как одном из наиболее доступных и эффективных способ анализа данных.
Методика: исследование проводилось в кабинетном (изучение теории, изучение и анализ специализированной литературы) и полевом (эмпирическом) форматах. В рамках кабинетной части исследования были проанализированы отчеты различных открытых источников. В рамках полевой части проводился опрос в формате анкетирования с использованием специально разработанных Google-форм.
Актуальность темы заключается в том, что возникновение новых задач требует постоянного появления новых направлений машинного обучения. А недостаточный уровень осведомленности населения всё ещё не позволяет использовать данные возможности более эффективно.
Для погружения в данную тематику необходимо начать с рассмотрения исторических аспектов, чтобы прийти к пониманию того, как появились технологии машинного обучения и наука искусственного интеллекта в целом.
История ML началась с работ 1950-х – 1960-х годов. Прародителями ML можно считать Артура Сэмюэля, Джозефа Вейцбаума и Фрэнка Розенблатта. Самюэль стал известен в 1952 году, создав самообучающуюся программу «Checkersplayer». Далее в 1966 году был написан виртуальный собеседник Вейцбаума «ELIZA». В конце 1950-х годов свет увидела система «Mark I Perceptron» Розенблатта. Именно в этот период начинает зарождаться сначала идея, а затем и теория машинного обучения, ученые осознали, что практическая передача знаний обучаемой машине может строиться на основе теории вычислительного обучения. С понятием искусственного интеллекта неразрывно понятие теста Тьюринга [1, с. 14]. В 1950-е Тьюринг издал статью «Может ли машина мыслить». В ней описана процедура, позволяющая точно определить, насколько близок уровень интеллекта машины к человеку.
В таблице 1 представлена хронологическая цепочка событий.
Таблица 1 – Хронология развития искусственного интеллекта
Дата |
Событие |
1943 г. |
впервые опубликованы научные труды (Маккалок и Питтс), где отражены идеи искусственных нейронных сетей и предложена модель искусственного нейрона. |
1949 г. |
описаны принципы Хебба для обучения групп нейронов. |
1950 г. |
проведение исследований Алана Тьюринга. |
1954 г. |
возникновение и развитие компьютерной лингвистики (машинный перевод текстов). |
1956 г. |
введено понятие искусственного интеллекта. |
1965 г. |
создание первой экспертной системы Dendral. По данным пользователя, экспертная система выдавала результат в виде химической структуры. |
1966 г. |
создана компьютерная программа Вейцбаума «ELIZA. |
1969 г. |
начало развития робототехники, создание первого универсального робота. |
1970 г. |
создание экспертной системы для анализа симптомов инфекционных заболеваний крови MYCIN. |
1971 г. |
создание первого мобильного робота. |
1981 г. |
создание промышленных роботов с микропроцессорным управлением и развитой сенсорикой. |
1982 г. |
создание нейронной сети Хопфилда с двухсторонней передачей информации. |
1982 г. |
разработана система распознавания речи. |
1997 г. |
компьютер обыграл человека в шахматы. |
2009 г. |
создание поисковой системы с распознаванием речевых запросов. |
2010 г. |
начало повсеместного использования технологий искусственного интеллекта и машинного обучения в различных приложениях и устройствах. Созданы новые эффективные алгоритмы обучения нейтронных сетей. |
Примечание – Источник: составлено автором на основе [3].
Если следовать закону Мура, можно подсчитать, что к 2030 году скорость работы компьютера может составить конкуренцию уровню работы мозга человека. И уже после 2040-ых годов искусственный интеллект будет способен самообучаться, что позволит машине превзойти способности человека.
В современном мире невозможно переоценить влияние машинного обучения, масштабы его распространения растут с каждой секундой. Оно охватывает широкий спектр приложений от финансовых институтов, гостиниц и ресторанов, сервисов доставки до оборудования, используемого на производствах в разных отраслях. Повсеместная информатизация приводит к накоплению огромных объёмов данных в науке, производстве, бизнесе, транспорте, здравоохранении.
Машинное обучение (Machine learning, ML) – это научно-технологическое течение, которое решает задачу обучения компьютеров. Оно представляет собой перечень методов и алгоритмов в области искусственного интеллекта, которые применяют для машинного обучения моделей. Для того, чтобы обучить модель, необходимо предоставить ей для обработки огромные массивы данных, в которых модель будет искать зависимости и закономерности для дальнейших предсказаний.
Термин «искусственный интеллект» был введён известным специалистом в области информатики Джоном МакКарти на Дартмутском семинаре 1956 года. Сегодня под понятием «искусственный интеллект» (Artificial intelligence, AI) подразумевают технологические и научные решения и методы, которые помогают сделать программы по подобию интеллекта человека. Artificial intelligence включает в себя множество инструментов, алгоритмов и систем, среди которых также все составляющие Data science и Machine learning. Отсюда AI – это куда более общее понятие нежели ML.
Вернемся к рассмотрению машинного обучения. Это один из разделов науки искусственного интеллекта, а именно ML представлено алгоритмами, которые дают компьютеру возможность делать выводы и принимать рациональные решения на основании данных. В результате машина может найти взаимосвязи в сложных и многопараметрических задачах, на решение которых человеческий мозг пока не способен. Машинное обучение стремится к наиболее верному прогнозированию.
На рисунке 1 показаны некоторые области знаний, которыми оперирует ML.
Рисунок 1 – Составляющие машинного обучения
Целью машинного обучения, как уже было отмечено ранее, является автоматизированное решение различных сложных аналитических задач. На основании входных данных модели машинного обучения воспроизводят точные прогнозы, которые в свою очередь служат основанием для принятия решений практически во всех сферах жизни. Это крайне перспективный инструмент для бизнеса.
После обучения компьютер способен предсказывать, запоминать и воспроизводить результат, а также выбирать лучшую из нескольких альтернатив.
Само по себе машинное обучение строится на трех компонентах:
1. Данные (data) – базовые факты и информация, которая пригодна для дальнейшей обработки в информационном процессе. В ML это любые выборки данных, работе с которыми нужно обучить систему. Данные для обучения предоставляются клиентами. Их сбор является наиболее сложным и медленным этапом.
2. Признаки (features) – это ключевые бизнес-потребности, те характеристики и свойства, которые система будет отслеживать на протяжении всех этапов обучения. Качество выборки отвечает за точность предсказания. Каждый объект в природе обладает собственными характеристиками, некоторые являются более индивидуальными, а некоторые более общими. Задача системы – научиться разделять важное и малозначительное, ведь правильность избранных свойств прямо влияет на результат.
3. Алгоритмы (algorithms) – непосредственно сами методы, которыми система будет руководствоваться для достижения бизнес-цели клиента. От выбранного метода зависит скорость и точность результата обработки исходных данных.
По наличию учителя, машинное обучение делится на обучение с учителем (Supervised Learning), обучение без учителя (Unsupervised Learning) и обучение с подкреплением (Reinforcement Learning) (см. рис. 2).
Рисунок 2 – Виды машинного обучения
По типу применяемых алгоритмов можно выделить два вида:
1. Классическое обучение. В основном применяется в таких направлениях работы с данными как: классификация, кластеризация, регрессия, прогнозирование и кластерный анализ и т.д. [2].
2. Глубокое обучение (Deep learning) – область исследований машинного обучения. Оно может быть описано в виде нескольких скрытых слоев искусственных нейронных сетей. Методология глубокого обучения применяет нелинейные преобразования и модельные абстракции на больших базах данных.
Перейдем к эмпирическому этапу работы, был проведен опрос в виде анкетирования, реализующий следующие задачи исследования:
1. Выяснить возраст опрашиваемых людей.
2. Выяснить знают ли участники опроса, что такое машинное обучение и технологии искусственного интеллекта.
3. Выяснить, что именно о машинном обучении и искусственном интеллекте люди знают (проекты, разработки, методы, алгоритмы, принципы, выдающиеся личности в этих областях).
4. Выяснить, о каких популярных разработках и проектах учасиники опроса в курсе.
5. Выяснить мнение респондентов о перспективе машинного обучения и технологий искусственного интеллекта.
Результаты опроса:
В исследовании приняло участие 1018 человек, среди них были как люди, не имеющие тесной связи с ИТ-индустрией, так и занятые в сфере цифровых сервисов. Большинство респондентов (77%) представили возрастной группы от 14 до 25 лет (возрастная структура участников анкетирования представлена на рисунке 3). При этом 51% опрошенных не знают ничего о технологиях, описанных в статье, что подтверждает актуальность темы (см. рис. 4).
Рисунок 3. Возрастная структура участников опроса
Рисунок 4. Информированность участников опроса о технологиях ML&AI
Тем (23%), кто ранее сталкивался с понятиями AI и ML было предложено рассказать об их познаниях. Основным источником информации для людей стали научно-фантастические фильмы и книги о роботах, многие вспомнили о технологиях «умного дома», автономном транспорте, чат-ботах в социальных сетях. 72% участников анкетирования не имеют понятия о принципах работы и алгоритмах машинного обучения.
Среди проектов, связанных с машинным обучением на слуху у респондентов на первом месте оказались нейронные сети Google, технологии поиска контента Pinterest и новостная лента Twitter (см. рис. 5).
Рисунок 5. Наиболее популярные среди респондентов ML-проекты
Люди считают, что наука о данных и технологии сильно продвинулись и уже сегодня модифицирует повседневную жизнь, результат на рисунке 6. Они поддерживают Мнение о том, что машинное обучение – это новый этап в развитии человечества.
Рисунок 6. Мнение респондентов о влиянии на жизнь науки о данных
По мнению участников технологии ML и AI наиболее востребованы в областях интернет-сервисов и соцсетей, финансов, медицины и образования (см. рис. 7).
Рисунок 7. Востребованность применения технологий в различных областях
Заключительным этапом опроса являлось выявление желания людей углубить познания о технологиях искусственного интеллекта и машинного обучения. Результат продемонстрирован на рисунке 8. 94% респондентов хотят повысить уровень знаний по данной теме.
Рисунок 8. Уровень желания участников опроса совершенствовать свои знания о технологиях ML&AI
По результатам данного исследования можно сделать вывод, что актуальность работы имеет высокий уровень. Абсолютное большинство респондентов считает, что за ML и AI стоит наше будущее, это не может не радовать. Из негативных результатов можно отметить, что в распространении знаний по этой теме могут возникнуть некоторые затруднения, так как мало кто знаком со смыслом существования технологий.
Заключение: в результате проведённого исследования был изучен уровень осведомленности населения о технологиях машинного обучения и искусственного интеллекта. Только 23% участников анкетирования знакомы с данными технологиями (при этом 21% знают о существовании искусственного интеллекта и лишь 5% слышали о машинном обучении), но 94% респондентов заинтересованы в увеличении уровня своих знаний по изученному вопросу. Таким образом на распространение подобных технологий может оказывать влияние тот факт, что малая доля людей понимает смысл их существования. Опрос вдохновляет проводить дальнейшие исследования в этой области, ведь данная тема многим не безразлична. Кроме того, область имеет огромный потенциал для развития в будущем, поскольку при умелом подходе, комбинируя различные виды машинного обучения, можно добиться автоматизации большинства рутинных бизнес-процессов. Иными словами, алгоритмы и роботы, подготовленные при помощи машинного обучения, смогут выполнять всю рутинную работу. Людям же остается творческая часть: составление стратегий, ведение переговоров, заключение договоров и прочее. Это важный фактор, поскольку машина не может выйти за заданные ей рамки, а человеческий мозг способен мыслить нешаблонно.
Рецензии:
27.09.2020, 21:16 Олевский Виктор Аронович
Рецензия: Замечательная информационно - популярная статья, непонятно в чём её научность и, тем более, в чём научная новизна?