Разработки речевых технологий в России и за рубежом
В России одной из ведущих компаний по разработке речевых технологий является «Центр речевых технологий» (ЦРТ). В настоящее время ЦРТ является ведущими разработчиками инновационных систем в сферах синтеза и распознавания речи. За последние месяцы компания выпустила VOCO (новое решение для преобразования речи в текст), представила программный комплекс интеллектуального анализа спонтанной речи, повысила эффективность управления аэропортом «Шереметьево», а также приняла участие в крупнейшей Российской выставке технологий «Интерполитех-2015».
Аналогом ЦРТ, а также мировым лидером в области развития речевых технологий является корпорация Nuance Communication. Это производитель программного обеспечения, штаб которой расположен в США. Компания разрабатывает приложения распознания речи в веб сервисах и системы автоматизированной обработки звонков.
Последние из разработок Nuance:
IVR Caller Verification технология с большим функционалом, позволяющая оценивать эффективность сотрудников, настраивать переадресацию входящих звонков, идентификацию пользователей и многое другое в полностью автоматическом режиме.
FreeSpeech – эта система позволяет идентифицировать абонента в ходе естественного разговора, извлекая необходимые голосовые характеристики (например, тон голоса или акцент).
VocalPassword – это двух шаговая идентификация по голосу пользователя и какому-любо паролю. Для защиты пользователя от взлома при помощи записи голоса, пароль повторяется несколько раз, и результаты должны различаться. Минус этого подхода затраты времени на повторение пароля и анализ данных программой.
Сферы применения голосового управления
Речевые технологии охотно используются в медицине, например, для коррекционно-развивающей работы с людьми, у которых имеются нарушения звукопроизношения и/или слуха.
Речевые системы так же внедрены и эффективно работают в банковских организациях. Они используют технологии голосового самообслуживания и обеспечивают быстрый доступ абонентов к запрашиваемой информации.
Новым шагом авиационных компаний стало использовании технологий распознавания естественной речи, что позволило значительно улучшить качество обслуживания пассажиров, а также сократить расходы.
Голосовые системы самообслуживания помогли операторам телекоммуникационной связи улучшить процесс обслуживания абонентов, поскольку ускорилась обработка звонков, уменьшилось количество ошибочных соединений, усовершенствовалась защита персональных данных клиентов.
Организация голосовых центров самообслуживания в компаниях, которые работают в различных сферах страховой деятельности, также помогла повысить качество обслуживания клиентов, обратившихся в контактный центр и сократить расходы.
Так же в последнее время речевые технологии популяризовались и в повседневной жизни, быту. Например, в помощь молодым родителям производят «электро-няню», на сегодняшний день она уже имеет и звук, и видео, и обратную связь.
Системы голосового управления помогают обеспечить контроль над некоторыми функциями автомобиля. Эти технологии позволяют водителям, не отвлекаясь, вести автомобили, тем самым обеспечивая безопасность движения на дороге.
Заключение
На данный момент применение речевых технологий в бизнесе связано с большими затратами на оборудование и сопутствующее программное обеспечение. Однако, несмотря на экономическую дороговизну этой новинки, она уже окупает себя. И постепенно внедряется все большим числом предприятий.
Технологии не стоят на месте и суммы инвестирования в область речевых технологий, только растут. Со временем обязательно появятся недорогие аналоги, которые все больше будут заменять человека в обслуживании звонков и заказов. На данный момент, уже есть наработки гидов для музеев и других голосовых помощников.
Конечно, сейчас это больше утопия, поскольку компьютер еще не способен разговаривать с интонацией, а полноценное распознавание слитной устной человеческой речи - невозможно. Но факты говорят о том, что эра голосовых помощников не за горами.
Список литературы
1) А.В. Фролов, Г.В. Фролов Синтез и распознание речи. Современные решения. 2012
2) Б.М. Лобанов, Л.И. Цирюльник «Компьютерный синтез и клонирование речи», Минск «Белорусская Наука», 2008.
3) Матвеев Ю.Н. Технологии биометрической идентификации личности по голосу и другим модальностям // Вестник МГТУ им. Н.Э. Баумана 2012.
4) ЦРТ [Электронный ресурс] режим доступа http://www.speechpro.ru/
5) Nuance Communication. [Электронный ресурс] режим доступа http://www.nuance.co.uk/