Облачный сервис 3i Speech Recognition, разработанный 3iTech, вышел в финал конкурса технологических проектов GoTech в номинации «Ростелеком».
3i Speech Recognition создан для работы с записями ТВ и радиоэфиров, материалами продакшн-студий, обращениями в контакт-центры и т. д. Точность распознавания у сервиса выше 90%. При этом есть редакторский интерфейс, который позволяет вносить правки в распознанный текстовый. Персональное облачное хранилище 3i Speech Recognition позволяет загружать аудио- и видеоинформацию, обрабатывая ее в несколько раз быстрее реального времени звучания. После выдает текст с расставленной пунктуацией. Сервис оснащен режимом «подсветки» озвучиваемого фрагмента, который упрощает редактирование.
«Речевые технологии – одни из самых динамично развивающихся. Они применяются для идентификации клиентов, управления сервисами, контроля качества работы сотрудников. И сферы применения «голоса» только расширяются. Наш сервис ориентирован на специалистов, работающих с голосовой информацией. Например, он может применяться в контакт-центрах для контроля качества работы сотрудников», - говорит председатель совета директоров консорциума 3i Technologies Алексей Любимов.
В сервисе используются языковые и акустические модели, построенные с применением машинного обучения, технологий рекуррентных нейронных сетей (Recurrent Neural Network, RNN) и взвешенных конечных автоматов (Weighted Finite State Transducer, WFST). Вычислительная инфраструктура реализована с ускорением на GPU, что позволяет получать многократный прирост производительности относительно CPU. Языковые модели для повышения качества распознавания могут быть адаптированы под узкую предметную область. Сервис поддерживает русский, английский, китайский, немецкий и испанский языки.
Финал конкурса пройдет в рамках форума GoTech Arena 20 ноября 2018 года в Москве. Победители получат возможность провести пилотный проект и начать сотрудничество с крупнейшей телекоммуникационной компанией страны «Ростелекомом».