Рекламодатель: АО «Топ Системы»

ИНН 7726601967 ОГРН 1087746953557

Рекламодатель:
ООО «С3Д Лабс»

ИНН 7715938849 ОГРН 1127747049209

2 - 2021

Голосовые помощники в системе принятия решений на основе искусственного интеллекта

Василий Иванов
Кандидат военных наук, полковник, доцент кафедры боевого применения войск связи, Военная академия связи «-имени Маршала Советского Союза С.М. Будённого» МО РФ.
Максим Черенкевич
Майор, слушатель специального факультета, Военная академия связи «имени Маршала Советского Союза С.М. Будённого» МО РФ.
Александр Масевцев
Сержант, факультет радиосвязи, Военная академия связи «имени Маршала Советского Союза С.М. Будённого» МО РФ.
Максим Андриенко
Рядовой, оператор научной роты, Военная академия связи «имени Маршала Советского Союза С.М. Будённого» МО РФ.

Сегодня у многих людей нет времени вручную искать в Интернете ту или иную информацию или ответы на свои вопросы — они предпочли бы, чтобы кто-то сделал это за них как личный помощник, который выслушает предоставленные команды и поступит соответствующим образом.

Благодаря искусственному интеллекту этот персональный помощник теперь может быть доступен каждому в виде голосового помощника, который гораздо быстрее и надежнее человека. Этот помощник способен выполнять даже такие сложные задачи, как размещение заказа в Интернете, воспроизведение музыки, включение света и т.д., просто слушая команду пользователя.

Голосовой помощник — это сервис, работающий на основе искусственного интеллекта. Он умеет распознавать человеческую речь и выполнять определенные действия в ответ на голосовую команду. Чаще всего голосовые помощники используются в смартфонах, приложениях или веб-сервисах.

Функционал голосовых помощников весьма разнообразен. Как правило, они способны вести диалог, предлагать быстрые ответы на вопросы пользователя, совершать звонки, прокладывать маршруты, открывать другие сервисы.

Самый первый электронный синтезатор речи был изобретен Гомером Дадли, сотрудником компании Bell, в 1937 году. Аппарат назывался Voder (рис. 1).

Рис. 1. Первый голосовой распознаватель чисел, разработанный сотрудниками лаборатории Bell

Рис. 1. Первый голосовой распознаватель чисел, разработанный сотрудниками лаборатории Bell

Советский физик Лев Мясников стал первым, кто занялся распознаванием речи с помощью электроники. Он работал над этой проблемой с 1939 года в рамках диссертации «Техническая фонетика».

В 1952 году появился первый голосовой распознаватель чисел от 1 до 9, который разработала всё та же Bell. Аппарат назывался Audrey (Automatic digital recognizer) и работал с помощью телефона. Оператор называл число, а аппарат распознавал его, сравнивая с имеющимися образцами.

Первый массовый продукт по распознаванию речи — программа Dragon Dictate — был выпущен в 1990 году. В 1994-м был представлен IBM ViaVoice, а в 1995 году Bell анонсировала телефонную систему Val для автоматизации работы диспетчеров и маршрутизации звонков.

На данный момент большую часть рынка занимают зарубежные голосовые помощники, такие как «Окей, Google», «Привет, Siri», «Алекса», «Привет, Cortana».

В России компания «Яндекс» представила в 2017 году голосовой помощник «Алиса». Отличный продукт, который в связке с экосистемой от компании «Яндекс» по сей день показывает отличные результаты своей работы. Основное преимущество данного голосового помощника перед зарубежными — это умение понимать русский язык и говорить на нем.

«Алиса» умеет:

  • искать информацию в Интернете по запросу и давать быстрые ответы;
  • распознавать музыку и подбирать музыку под настроение;
  • определять, что изображено на картинке, находить похожие картинки;
  • находить товары в сервисе Яндекс.Маркет по фото товара;
  • рассказывать сказки;
  • вызывать такси в сервисе Яндекс.Такси;
  • играть в игры;
  • уточнять число и день, место и время;
  • давать рекомендации, как одеться по погоде.

Разрабатывать этот голосовой помощник начали в конце 2016 года. «Яндекс» тогда уже использовал голосовое управление в приложении «Поиска», в «Навигаторе» и др. Его целью было создать голосовой помощник, который сможет взаимодействовать с людьми в форме осмысленного диалога.

Тестирование «Алисы» началось весной 2017 года, а 21 сентября ее продемонстрировали президенту РФ Владимиру Путину в ходе посещения им «Яндекса» накануне 20-летнего юбилея компании. Тогда глава государства задал «Алисе» несколько вопросов. Официально же запуск «Алисы» произошел 10 октября того же года.

Что же необходимо для работы таких систем, как «Алиса»? Ответ прост, но нелегок в реализации. Для начала необходима система принятия решений.

Система принятия решений — это компьютеризованная программа, применяемая для поддержки определений, суждений и действий. Она просматривает и анализирует огромные объемы данных, собирая исчерпывающую информацию, которую можно использовать для решения проблем и принятия решений. Система может быть полностью компьютеризована или работать по команде, под управлением человека. В некоторых случаях она может сочетать и то и другое. Идеальные системы анализируют информацию и фактически принимают решения за пользователя. По крайней мере, они позволяют пользователям-людям быстрее принимать более обоснованные решения.

Наиболее популярная система принятия решений работает по стратегии в теории игр. Теория игр, изучающая процесс принятия стратегических решений, объединяет разрозненные дисциплины, такие как математика, психология и философия. Теория игр была изобретена Джоном фон Нейманом и Оскаром Моргенштерном в 1944 году и с тех пор прошла долгий путь.

Основная цель использования систем принятия решений — представить информацию клиенту в простой для понимания форме. Система выгодна тем, что ее можно запрограммировать на создание многих типов отчетов. Например, система принятия решений может генерировать информацию и выводить ее в графическом виде, например в виде гистограммы, представляющей прогнозируемый доход, или в виде письменного отчета.

Поскольку система принятия решений — это, по сути, приложение, его можно загрузить в большинство компьютерных систем, будь то настольные компьютеры или ноутбуки. Некоторые приложения также доступны через мобильные устройства.

Гибкость таких систем чрезвычайно полезна для пользователей, которые часто путешествуют. Это дает им возможность всегда быть хорошо информированными, предоставляя возможность принимать оптимальные решения для своей компании и клиентов на ходу или даже на месте.

Один из главных пунктов для голосового помощника мы рассмотрели. Система принятия решений с логикой помощника не сможет работать достаточно хорошо, так как база ответной информации будет минимальной, а постоянно добавлять в словарь ответы помощника — трудоемкое и даже неприемлемое для разработчиков занятие. Чтобы решение проблем со словарем ответов и вариаций ответов потребовало минимальных расходов, необходим искусственный интеллект (ИИ).

Голосовые помощники на базе искусственного интеллекта — это программы. Они могут использовать определенное оборудование, например умный динамик. Кроме того, вы можете найти такие программы в качестве функции на своем смартфоне, ноутбуке или носимом устройстве.

Эти помощники принимают направления или запросы от пользователя. Впоследствии они находят информацию и выполняют задание. Более ранние программы при выполнении задач для своих пользователей применяли автоматизацию на основе правил. Однако цифровые помощники на базе искусственного интеллекта работают по-иному.

Эти цифровые помощники нового поколения используют искусственный интеллект и следующие его возможности:

  • распознавание голоса — помогает цифровому помощнику установить подлинность пользователя;
  • голосовая «Обработка естественного языка» (NLP) — позволяет помощникам понимать голосовые запросы пользователей и отвечать им после сбора необходимой информации и выполнения задачи;
  • «Машинное обучение» (ML) — цифровые помощники на базе искусственного интеллекта используют ввод от пользователя и другую информацию, которую они собирают для выполнения задач. Кроме того, такие интеллектуальные помощники пользуются для этой цели личными данными пользователей и историей использования ими наиболее часто встечающейся информации. Машинное обучение помогает им обрабатывать эти данные и выводить из них полезные закономерности (рис. 2).

Рис. 2. Мозг голосовых помощников на основе ИИ — 
стреляющие нейронные сети

Рис. 2. Мозг голосовых помощников на основе ИИ — стреляющие нейронные сети

Приведем несколько примеров.

Обучение и развитие. При обучении и развитии важно не только формальное образование, но и обучение на рабочем месте. Цифровые помощники на основе ИИ могут помочь своим пользователям учиться на работе, подбирая по требованию пользователя необходимую информацию, освобождая их от рутинного перелистывания сайтов (страниц) Интернета. Более того, они могут отслеживать интересующую пользователя информацию и предоставлять ее с учетом интереса пользователя. Следовательно, возможности персонализации цифровых помощников могут оказать пользователю необходимую поддержку.

Доступность. Люди с ограниченными возможностями могут извлечь большую пользу из интеллектуальных цифровых помощников. Цифровые помощники на основе искусственного интеллекта могут открыть для них новые возможности получения информации, необходимой для выполнения задачи. Например, люди с нарушениями зрения могут воспользоваться голосовыми рекомендациями этих виртуальных помощников (рис. 3).

Рис. 3. Схема работы голосового помощника с системой принятия решений

Рис. 3. Схема работы голосового помощника с системой принятия решений

Интеллектуальная автоматизация повторяющихся задач. В рабочих процессах каждой организации есть несколько повторяющихся задач, решение которых можно осуществить на основе их автоматизации. Виртуальные помощники на основе ИИ могут поднять такую автоматизацию на более высокий уровень, поскольку они обладают гораздо большими возможностями, чем автоматизация на основе правил. Алгоритмы машинного обучения могут изучать шаблоны повторяющихся задач и определять оптимальный способ их выполнения. Это позволяет организациям автоматизировать повторяющиеся задачи, которые ранее требовали вмешательства человека (рис. 4).

Рис. 4. Принцип работы голосового помощника с искусственным интеллектом

Рис. 4. Принцип работы голосового помощника с искусственным интеллектом

Голосовой помощник, которого захотел бы иметь каждый, по возможностям голосового взаимодействия должен быть неотличим от помощника-человека. Когда технологии достигнут подобного уровня, спрос на таких помощников-компаньонов станет космическим.

Пока же полезность голосового помощника определяется в первую очередь не его интеллектом, а качеством распознавания речи и интегрированностью в различные узлы связи.

Для реализации голосового помощника в системе принятия решений на основе ИИ необходимы три главные вещи: правильно подобранный софт, алгоритм системы принятия решений и обученный искусственный интеллект, который будет работать в связке с системой принятия решения выбора ответа. При сохранении описанных выше условий и возможностей будет получен отличный помощник, который без помощи разработчиков будет развиваться и добавлять к себе в базу ответы и решения, близкие к человеческим.

Список используемых источников:

  1. Сайт Истории голосовых помощников // URL: https://www.profiz.ru/sr/2_2016/PA/ (дата обращения 10.01.2021).
  2. Сайт Голосовые помощники: как помощники искусственного интеллекта меняют нашу жизнь каждый день // URL: https://www.smartsheet.com/voice-assistants-artificial-intelligence (дата обращения 10.01.2021).
  3. Сайт Создание многофункционального голосового помощника // URL: https://towardsdatascience.com/building-a-multi-functionality-voice-assistant-in-10-minutes-3e5d87e164f0 (дата обращения 10.01.2021).
  4. Иванов В.Г., Корякин Д.Д. Перспективы применения математических методов прогнозирования в системах мониторинга локально-вычислительных сетей. В сб.: Актуальные проблемы инфотелекоммуникаций в науке и образовании (АПИНО 2018). VII Международная научно-техническая и научно-методическая конференция. Сб. научн. статей. В 4-х томах. Под редакцией С.В. Бачевского. 2018. С. 406-409.
  5. Сайт Как стратегия на основе теории игр улучшает процесс принятия решений // URL: https://www.investopedia.com/articles/investing/111113/advanced-game-theory-strategies-decisionmaking.asp(дата обращения 10.01.2021).

Регистрация | Войти

Мы в телеграм:

Рекламодатель:
ООО «Нанософт разработка»

ИНН 7751031421 ОГРН 5167746333838

Рекламодатель: АО «Топ Системы»

ИНН 7726601967 ОГРН 1087746953557