Как устроен процесс распознавания и понимания речи пользователя? Как работает голосовой поиск? Что представляют собой интеллектуальные голосовые помощники? В этой статье мы разберем основные понятия и термины в области голосовых технологий и интерфейсов.
Распознавание речи – это процесс преобразования речевого сигнала в цифровую информацию. Именно этот процесс позволяет организовать речевое управление компьютером или программой и осуществить ввод текста с микрофона. Эта технология позволяет создавать голосовое командное управление ПК, системы диктовки текста или средства идентификации по образцу речи.
Понимание речи – процесс, при котором компьютер или программа воспринимает смысл сказанного. Такая возможность стала реальной благодаря технологии искусственного интеллекта (ИИ). Благодаря ИИ речевой интерфейс может не только дублировать голосовые команды.
Еще по теме: Что такое голосовые технологии и интерфейсы
Голосовой поиск (или голосовая команда) – функция поиска информации без использования клавиатуры. Пользователь произносит фразу, а приложение распознает текст, выполняет поиск и предоставляет результаты на странице поисковой выдачи. Голосовой поиск, в отличие от классического, взаимодействует с пользователем с помощью диалогов, а не посредством ключевых слов и фраз.
Например, по информации аналитика Google Гэри Илш, число голосовых запросов в 2015 году увеличилось в два раза. И такие запросы были чаще связаны с действиями, чем печатные.
Интеллектуальные голосовые помощники (или голосовые ассистенты) – это веб-сервисы, которые объединяют технологию распознавания речи и текста и поиска информации по ключевым словам. Голосовые помощники умеют распознавать речь, определять значение сказанного и синтезировать голос для ответа. Основные приложения: Alexa Amazon, Siri Apple, OK Google, Кортана Microsoft, «Алиса» Яндекса.
Голосовые ассистенты используются не только в мобильных приложениях и персональных компьютерах, но и в устройствах умного дома. Они могут быть внедрены в холодильники, бытовую технику, машины. Или же представляют собой беспроводные динамики, снабженные голосовым управлением.
Первопроходцем в области голосовых интерфейсов выступает компания Amazon. Она выпустила голосового помощника для дома Amazon Echo. Echo Show – это первичное голосовое устройство. На его экране нет привычных значков приложений. Но когда пользователь отправляет голосовую команду, экран отображает всю связанную с ней информацию. Google также имеет аналог голосового ассистента для дома Google Home.
Еще по теме: Видеокарточки Теплицы: Что может голос
Облачные АТС (или облачная телефония) – программное обеспечение, которое заменяет физическую офисную телефонную станцию. Клиент подключается к услуге с помощью Интернета. АТС – это телефонная система компании, способная обеспечить подключение внутренних номеров к внешним телефонным линиям и мобильным сетям.
Веб-интерфейс АТС позволяет управлять звонками, подключать к системе IP-телефоны, просматривать статистику по звонкам, записывать и сохранять разговоры. Облачную АТС можно интегрировать с CRM-системой (системой управления взаимоотношениями с клиентами). Благодаря такой возможности при входящем вызове менеджер уже видит карточку клиента, а звонок автоматически попадает на ответственного менеджера.