Новый движок построен на базе end-to-end архитектуры с использованием нейросетей и машинного обучения (machine learning). 3i ASR 2.0 обучен на выборке в несколько тысяч часов с аугментацией данных (внесением разных типов искажений). Это позволило значительно снизить уровень относительной ошибки и повысить качество распознавания живой речи.
Вычислительная инфраструктура реализована с ускорением на GPU, что позволяет получать многократный прирост производительности относительно CPU. Новый движок дает возможность распознавать массивы речевой информации в более чем сто раз быстрее их реального звучания.
"Технологии распознавания речи и системы, созданные с их использованием, меняют привычные сервисы. Все уже сталкивались с тем, что речевую систему можно встретить в контакт-центре, позвонив в техподдержку. Нас прекрасно понимают электронные устройства, когда мы голосом диктуем, например, поисковый запрос. Продукты 3i Technologies контролируют диалоги сотрудников транспортных компаний с клиентами, или общение работников ритейла. По "голосу" мы выявляем телефонных мошенников. B c каждым днем сфера применения речевых технологии расширяется, при этом заказчики становятся все более требовательными к качеству распознавания и скорости обработки речевой информации. И новый движок – это ощутимый шаг вперед", - говорит председатель совета директоров 3i Technologies Алексей Любимов.
Движок 3i ASR 2.0 будет использоваться как в новых продуктах, так и в тех, которые уже внедрены. Например, он будет интегрирован в облачный сервис для профессиональной обработки речевых данных 3i Speech Recognition, в облачную платформу речевой аналитики 3i Touchpoint Analytics и другие продукты и сервисы компании. Миграция на новый движок произойдет бесшовно.