Публикация научных статей.
Вход на сайт
E-mail:
Пароль:
Запомнить
Регистрация/
Забыли пароль?

Научные направления

Поделиться:
Статья опубликована в №19 (марта) 2015
Разделы: Информационные технологии
Размещена 17.03.2015. Последняя правка: 02.04.2015.
Просмотров - 5212

Естественно-языковой интерфейс как элемент пользовательского взаимодействия

Посевкин Руслан Владимирович

Университет ИТМО

Инженер-исследователь

Аннотация:
В работе рассматривается реализация взаимодействия пользователя с программной системой посредством естественно-языкового интерфейса. Описывается структура работы подобного интерфейса. Также представлен вариант реализации интерфейса с использованием ограниченного естественного языка.


Abstract:
This paper considers user's interaction to software system by using natural language interface. How it works is described. Also realization of interface with usage of limited natural language is presented.


Ключевые слова:
естественный язык; пользовательское взаимодействие; обработка естественного языка.

Keywords:
natural language; user’s interaction; natural language processing (NLP).


УДК 004.5

На сегодняшний день в мире существует  множество программных систем. Еще больше разработано принципов взаимодействия с ними. Разнообразие вариантов взаимодействия приводит к увеличению времени на обучение работы с системой, и, как следствие, затрудняет свободное использование этой системы.

Перспективным в данной ситуации является применение более привычного для пользователя естественного языка в процессе общения с машинами и компьютерными системами.

Данное решение обладает рядом преимуществ:

  • Минимальная подготовка пользователя для работы с системой.
  • Простота и высокая скорость задания произвольных запросов к системе.

Простота при работе с естественно-языковым интерфейсом достигается путем применения пользователем языка, используемого в ежедневной коммуникации.

Пользователи сети Интернет пытаются найти ответы на вопросы с помощью поисковых машин и форумов. В Интернете уже есть ответы на эти вопросы, вопрос только в том, насколько быстро может быть получен этот ответ.

Для решения подобной проблемы используется естественно-языковой интерфейс в составе диалоговой системы.

Поиск знаний, в отличии от простого поиска информации, требует учета семантики запросов. Для естественно-языкового пользовательского интерфейса вопросно-ответных систем можно также  использовать ограниченную лексику и грамматику языка. При этом не происходит серьёзного ухудшения функциональности и производительности вопросно-ответной системы. 

Ограниченный естественный язык – это подмножество естественного языка, текст на котором успешно воспринимается носителем полного естественного языка без приложения дополнительных усилий.

Не требуется дополнительного изучения ограниченной версии языка для составления текстов. Данный язык обладает сокращенным набором лексики и грамматики. Это позволяет сократить время анализа естественно-языковых элементов в вопросно-ответной системе, а также помогает избежать неоднозначностей на лингвистическом уровне.

Цикл работы естественно-языкового интерфейса начинается с ввода пользователем сообщения на естественном языке путём ввода текста. По введенному в систему тексту строится его формальное описание. Все предшествующие результаты анализа используются при анализе последующих запросов, что позволяет системе сохранять ход диалога с пользователем и разрешать спорные моменты, связанные с использованием одних и тех же терминов в разных предметных областях [1].

В процессе обработки естественно-языкового текста происходит последовательное выполнение морфологического, синтаксического и семантического анализа (рис. 1).
Схема обработки естественно-языкового текста

Рисунок 1 – Схема обработки естественно-языкового текста

Первым этапом обработки пользовательского запроса является морфологический и морфемный анализ. На данном этапе для каждого слова в формальной записи предложения строятся отношения, которые задают соответствия для значений грамматических категорий [3].

В результате морфологического анализа определяются морфологические характеристики каждого слова такие как падеж, склонение, часть речи и т.д. Количество и наличие морфологических характеристик слов и допустимых значений зависят от конкретного языка. Однако, некоторые характеристики (часть речи) существуют во многих языках.      

Для проведения процедуры морфологического анализа текста существует три различных подхода:

  1. «четкая» морфология;
  2. «нечеткая» морфология;
  3. вероятностный подход.

При обработке естественно-языковых (ЕЯ) текстов на русском языке в наиболее часто применяется подход, основанный на «четкой» морфологии. Данный подход базируется на словаре Зализняка [2].

В данном словаре описаны основные словоформы для русскоязычных слов. Каждой словоформе сопоставляется определенный код. Существует некая система правил, в соответствии с которой для данного слова  возможно  построить все остальные формы. При этом в качестве исходных данных используется начальная словоформа и соответствующий ей код. В случае использования «четкого» подхода в процессе морфологического анализа, необходимо иметь в наличии словарь всех словоформ и слов для данного языка. Данный словарь на входе принимает форму слова. На выходе словарь представляет морфологические характеристики конкретной словоформы. Возможно построение словаря на основе словаря Зализняка по следующему алгоритму: Первым шагом происходит перебор всех слов, содержащихся в словаре. Для каждого из этих слов необходимо определить все возможные словоформы. Полученные словоформы сохраняются в формируемом словаре. В процессе проведения морфологического анализа конкретного слова достаточно найти его в словаре. В результате будут получены точные значения всех морфологических характеристик анализируемого слова.

При морфемном анализе определяются конкретные морфемы в рамках каждого слова: приставка, корень, суффикс, окончание. В словаре морфем русского языка [4, 6] для каждого слова указано разделение на составные части. Однако,  в словаре не указываются типы каждой из составных частей. Таким образом, достоверно не может быть известно какая из частей является корнем, а какая суффиксом.

При этом совокупность всех возможных корней слов русского языка представляет собой открытое множество. В то же время, множество всех приставок, суффиксов и окончаний ограничено. Также известен порядок следования морфем в составе слова: сначала идут приставки, затем корни, далее суффиксы и окончания. Таким образом, с помощью словаря морфем русского языка возможно построить словарь, содержащий как  разбиение слова на составные части, так и тип каждой из морфем. В результате для проведения морфемного анализа слова достаточно просто обратиться к разработанному словарю.

При этом морфемный анализ не ограничивается обращениями к словарю. В ситуации, когда слово отсутствует в словаре, возможно непосредственное проведение анализа на основе стандартного строения слов русского языка (приставка — корень — суффикс — окончание) и множества всех приставок, суффиксов и окончаний [5].

На этапе синтаксического анализа внутри предложения определяются отношения синтаксических связей. Далее выявляются главные и второстепенные члены предложения, определяется тип предложения и т.д. Синтаксический анализ выполняется поэтапно: при описании формальной  структуры предложения используется информация, которая была получена ранее на этапе морфологического анализа. На этом этапе применяются лексические и синтаксические правила для анализируемого языка.

Этап семантического анализа представляет наиболее сложную часть обработки естественно-языкового текста. Семантический анализ можно представить как обработку семантической сети, которая отражает результат анализа на предыдущих этапах естественно-языкового текста, присутствующих в системе знаний о предметной области и языке программной системы. На данном этапе анализируются соотношения лингвистической конструкции и тех конструкций, которые хранятся в памяти системы для выявления отношений соответствия.

В процессе построения семантической модели слова учитывается его многозначность. Смысл слова рассматривается как некоторое множество различных значений. Каждое из этих значений или вся совокупность в целом реализуется в определенном контексте. Результатом семантического анализа является конструкция запроса к информационной системе.

Таким образом, применяя методы обработки естественно-языкового текста возможно создать интерфейс, позволяющий общаться с машиной на естественном языке.

Библиографический список:

1. Житко В.А. Пользовательский интерфейс интеллектуальных вопросно-ответных систему // NB: Кибернетика и программирование. — 2012. - № 1. - С.23-30. DOI: 10.7256/2306-4196.2012.1.13862.
2. Зализняк А.А. Грамматический словарь русского языка. Словоизменение. 3-е изд. М. Русский язык, 1987.
3. Крайванова В.А. Модель естественно-языкового интерфейса для систем управления сложными техническими объектами и оценка эффективности алгоритмов на ее основе // УБС. 2009. №26. URL: http://cyberleninka.ru/article/n/model-estestvenno-yazykovogo-interfeysa-dlya-sistem-upravleniya-slozhnymi-tehnicheskimi-obektami-i-otsenka-effektivnosti-algoritmov-na (дата обращения: 16.01.2015)
4. Кузнецова А.И., Ефремова Т.Ф. Словарь морфем русского языка. М. Русский язык, 1986.
5. Селезнев, К. Обработка текстов на естественном языке // «Открытые системы» , № 12, 2003.
6. Тихонов А.Н. Морфемно-орфографический словарь. М.: АСТ: Астрель, 2002. — 704 с.




Рецензии:

17.03.2015, 16:05 Клинков Георгий Тодоров
Рецензия: Статью можно опубликовать.Основания: 1.Актуальность проблематики... 2.Приложный характер програманого интерфейса как операциональный алгоритм действия... 3.Богатые возможности, которые создаются для лексикального и етимологического анализа в границах семиозиса языка.... 4.Нужно доказательственный материал разширить научными доводами аргументами....

17.03.2015 23:23 Ответ на рецензию автора Посевкин Руслан Владимирович:
Благодарю Вас за рецензию. Статья исправлена с учетом замечания.

31.03.2015, 18:13 Закирова Оксана Вячеславовна
Рецензия: К вопросу использования естественного языка для организации взаимодействия человека с компьютерной системой исследователи обращались неоднократно. Созданием естественно-языковых интерфейсов – достаточно сложных программ, целью которых является обработка и распознавание текста, занимаются и лингвисты, и специалисты в области программирования. Таким образом, тема статьи Посевкина Р.В. актуальна, однако предложенная в ней идея создания и алгоритма естественно-языкового интерфейса не является новой. В основе своей материал носит описательный характер и не обладает новизной (например, цикл работы естественно-языкового интерфейса детально воспроизводится в работе «Семантическая технология компонентного проектирования естественного-языкового интерфейса интеллектуальных вопросно-ответных систем» В.А. Житко, В. Н. Вяльцев, Ю. С. Гецевич, А.А. Кузьмин). На наш взгляд, материал нуждается в доработке: в статье отсутствует авторская позиция, поскольку в научной статье необходимо не просто сообщить фактическую информацию, но и обязательно выразить свое отношение к тому, о чем идет речь, предложить своё решение проблемы и т.д.
02.04.2015 0:00 Ответ на рецензию автора Посевкин Руслан Владимирович:
Уважаемая Оксана Вячеславовна, спасибо за подробную рецензию. Как Вы верно заметили, этапы обработки естественного языка в процессе работы естественно-языкового интерфейса рассматриваются в работах других исследователей. В частности, в работах В.А. Житко (как в указанной Вами, так и в материале из библиографического списка [1]) основное внимание уделяется именно этапу семантического анализа. В особенности, это можно заметить в работе «Технология проектирования естественно-языковых интерфейсов вопросно-ответных систем» (В.А. Житко, А.В. Заболеева-Зотова). В представленной выше работе акцент смещен в сторону морфологического и морфемного анализа. Также предлагаются конкретные подходы, которые можно использовать в процессе программной реализации морфологического и морфемного анализа.



Комментарии пользователей:

Оставить комментарий


 
 

Вверх