Искусственный интеллект. Общение с компьютером на естественном языке | iot.ru Новости Интернета вещей
92.26 € 99.71

Искусственный интеллект. Общение с компьютером на естественном языке

Одна из важнейших задач, которая стоит перед разработчиками высокоинтеллектуальных устройств, связана с созданием технологий, позволяющих человеку вести диалог с компьютером на естественном языке. Возможность понимать и применять в общении естественный язык является фундаментальным аспектом человеческого интеллекта. Наличие такой способности у машин будет не только сигнализировать об их высоком уровне развития, но и выведет процесс взаимодействия с ними на качественно новый уровень.

 

Особенности обработки естественного языка

Современная автоматизированная система обработки естественного языка (Natural Language Processing – NLP), являющаяся основой «"диалогового" интерфейса» между человеком и компьютером, состоит из двух компонентов:

  • Модуль машинного понимания естественного языка (Natural Language Understanding – NLU)

  • Модуль генерирования информации на естественном языке (Natural Language Generation – NLG)

Задача машинного понимания естественного языка заключается в определении в анализируемой информации заложенной смысловой нагрузки. После того, как машине удалось «понять» смысл проанализированных данных, она запускает процесс генерирования во внешнюю среду соответствующей информации, представленной в текстовой или акустической форме.

Основной сложностью создания «диалогового интерфейса» является неоднозначная трактовка естественного языка. Здесь даже у людей иногда могут возникнуть определенные трудности. Представьте себе, например, какие сложности может вызвать у человека, ничего не знающего о футболе, понимание смысла такой фразы:

«В центре полузащитник перехватил передачу верхом – мяч отскочил в штрафную соперника, где за него «на втором этаже» поборолись защитник и нападающий. Далее последовала передача на левого вингера, который с подъема положил мяч точно в нижний угол.»

Несмотря на то, что смысл каждого отдельного слова может быть понятен, целая фраза прозвучит для человека, никогда не сталкивающимся с футболом, как полная тарабарщина.

Исходя из подобного рода сложностей, ученые постоянно разрабатывают множество различных методов и технологий, позволяющих машине «понять» смысл каждой фразы наиболее точно. В настоящий момент, при обработке информации, представленной на естественном языке, данные проходят через несколько стадий анализа.

1.png

 Стадии автоматической обработки естественного языка


  • Первичная обработка. Представление входных данных в форме, пригодной для машинной обработки.

  • Морфологический анализ. Разделение анализируемого языка на абзацы, предложения и слова. Определение для каждого слова частей речи и различных морфологических характеристик (род, число, падеж и др.).

  • Синтаксический анализ. Выделение между словами грамматических связей. На данном уровне может иметься модуль предсемантической обработки, который фильтрует варианты, не представляющие смысловую нагрузку.

  • Семантический анализ. Определение нужного значения каждого слова. При этом в базе знаний каждое слово привязывается к его определенным значениям в зависимости от значений окружающих слов. Например, существительное «терминал» может означать устройство ввода вывода информации, быть частью аэропорта, морского порта или комплексом сооружений для накопления и сжижения газа.

  • Анализ дискурса. Определение семантических связей с учетом контекста. Понять смысл предложения иногда можно только в окружении других, как правило соседних предложений.

  • Прагматический анализ. На завершающей стадии анализируемая информация принимает то значение, которое в нее было изначально заложено. Конкретная мысль должна быть заключена в некую форму, которая будет понятна машине и пригодна для дальнейшей обработки: генерирования ответа или запуск необходимой процедуры.

 

Обзор рынка

По данным Global Industry Analytics глобальный рынок решений в области NLP к 2020 году достигнет отметки в $10 млрд. при ежегодном росте около 20%.

 2.png

При этом качество обработки естественного языка с каждым годом улучшается, чему в частности способствуют последние достижения в области глубокого машинного обучения и когнитивных вычислений. Также этому способствуют большие инвестиции среди игроков рынка. Как отмечалось в наших предыдущих обзорах, мировые IT-гиганты, такие как — Apple, Google, Amazon, Microsoft, IBM вкладывают огромные средства в исследования в области искусственного интеллекта, позволяющие машине понимать естественный язык. А российская компания ABBYY специально для этих целей разработала систему Compreno, которая занимается анализом текстовой информации. Разработка данной системы велась в компании около 10 лет и стоила около $ 80 млн.

Разработкой диалогового интерфейса активно занимаются и стартапы, такие как X.ai, ViV, VocaIIQ (приобретённая Apple), Мивар и др. Российская компания Мивар в том году вывела на рынок свою собственную платформу Tel!Mi, которая дает возможность машине осмысленно освоить весь массив человеческих знаний, зафиксированных в виде текстовой информации. В качестве основы для системы были заложены миварные принципы, которые технологически отличаются от принципов, используемых конкурентами.

«Для нас технология смыслового анализа текста — это этап на пути к созданию искусственного интеллекта нового поколения, который будет способен логически рассуждать и общаться с человеком на равных. Сначала мы презентовали миварный движок Wi!Mi, основу для создания нового класса продуктов — логически рассуждающих систем. Потом научили компьютер осмысленно читать и анализировать тексты», — рассказал в интервью CNews Олег Варламов, д.т.н., председатель научно-технического совета компании «Мивар».

По словам представителей компании, платформа Tel!Mi может быть использована для создания виртуальных помощников, секретарей и операторов контактных центров, которые будут способны дать содержательный ответ по любому вопросу и вести осмысленную беседу. Также платформа может применяться для анализа законодательных актов на непротиворечивость и обнаружения плагиата в научных работах.

 

Области применения

Программы, способные общаться с человеком на естественном языке уже активно используются в медицинской отрасли, беспилотных автомобилях, в виртуальных цифровых помощниках, и других областях. Мы становимся свидетелями того, как компьютеры постепенно начинают общаться с нами на естественном языке в различных сферах общественной жизни.

«На наших глазах происходит революция – мы начинаем общаться с компьютером на естественном языке и получать осознанные ответы» - говорит Давид Ян, основатель компании ABBYY.

Одним из наиболее успешных коммерческих проектов в этом направлении является суперкомпьютер Watson, который, используя программу DeepQA, способен с высокой четкостью обрабатывать вопросы на естественном языке. Так, в 2011 году Watson победил в передаче Jeopardy (российский аналог «Своя игра»), где ему необходимо было не только находить ответы на поставленный вопросы, но и понимать их смысл.

В настоящий момент Watson успешно применяется в различных областях, в том числе, и в коммерции. Так, в банковской сфере суперкомпьютер может детально объяснить клиентам все тонкости кредитной политики банка, а абонентам сотовых операторов – рассказать о способах подключения услуги или оплаты счета. Распознавать речь и обрабатывать голос суперкомпьютеру позволяет технология компании Nuance Communications.

По мнению многих экспертов, сегодня наиболее перспективным направлением применения технологий осмысленного анализа естественного языка являются помощники, консультирующие пользователя по различным вопросам и выполняющие различные задания. Достаточно известными сейчас являются голосовые помощники Apple Siri, Microsoft Cortana и Google Now, которые могут найти и прочитать интересную информацию из Интернета, найти кафе рядом с местоположением пользователя и выполнять другие полезные действия. Разработкой голосового ассистента также занимается компания Amazon. Помощник Alexa, встроенный в «умную» колонку Echo, может по командам пользователя самостоятельно управлять «умным домом»: включать свет в доме, проигрывать музыку, заказывать товары в интернет-магазине и др. Совсем недавно Sumsung представила инновационный холодильник, который может вести диалог на естественном языке как с помощью голоса, так и с помощью текста. Например, можно послать холодильнику через мессенджер сообщение «Есть ли у нас помидоры?» и получить от него осмысленный ответ.

По мнению многих экспертов, большими перспективами на рынке обладают боты-ассистенты, применяющиеся в мессенджерах. Компания Activate недавно провела исследование и выяснила, что в настоящий момент как минимум 2,5 миллиарда людей пользуются хотя бы одним мессенджером на своем смартфоне. Текстовые чат-интерфейсы мессенджеров, изначально предназначенные для общения людей друг с другом, могут использоваться как способ взаимодействия человека с различными сервисами и компаниями, если встроить в эти интерфейсы ботов с технологией понимания и анализа текстов. При этом пользователь может даже не догадаться о том, что общается не с человеком. В современных устройствах задействованы настолько продвинутые алгоритмы, что зачастую их очень сложно отличить от реальных собеседников. Так, два года назад программа «Евгений Густман», разработанная отечественными специалистами, впервые сумела пройти тест Тьюринга, убедив больше 30 % жюри, что они общаются с 13-летним мальчиком из Украины.


Чат-боты со встроенным искусственным интеллектом способны принести компаниям много пользы. Например, они могут использоваться в отделе техподдержки, круглосуточно общаясь с клиентами и тем самым оптимизируя время сотрудников. Однако в настоящий момент боты еще не могут самостоятельно решать на постоянной основе все проблемы пользователей. Поэтому эксперты рекомендуют использовать следующую модель использования бота. Клиент пишет запрос, машина его анализирует и выдает соответствующий ответ. Если запрос является нестандартным, то бот отправляет его специалисту. Подобную модель сейчас активно использует компания Facebook в проекте Facebook Messenger.

Помимо консультирования по различным вопросам, чат-боты могут по результатам общения с пользователями сформировать его индивидуальный профиль, в котором отображаются предпочтения клиента, и потом в какой-то момент предложить купить человеку действительно что-то ценное и необходимое. Чтобы бизнесу (call-центру, техподдержке, центру продаж) не зависеть от типа используемых мессенджеров на рынке предлагаются различные кросс-платформенные решения типа manychat.com. Такие решения предоставляют единый интерфейс для связи с клиентами вне зависимости от того, какими мессенджерами эти клиенты пользуются.

В настоящий момент количество чат-ботов на рынке стремительно растет. Например, в китайском мессенджере WeChat среди официальных аккаунтов доля ботов постоянно увеличивается. В аналогичном направлении развивается и Facebook Messenger, в партнерской программе которого находится уже несколько десятков компаний, интересы которых представляются искусственным интеллектом. И если взять во внимание прогноз аналитического агентства Gartner, которое предсказывает, что уже совсем скоро более 47% устройств смогут общаться с человеком на естественном языке, то в ближайшее время подобных примеров будет все больше и больше.


Источник фото: futurism.com

Подписаться на новости Обсудить

Назад

Комментарии

Текст сообщения*
Защита от автоматических сообщений