Консорциум 3i Technologies объявляет о новых возможностях в сфере обработки речи

22.01.2015
Новая технология 3i-Диаризация повышает эффективность обработки речевых записей

Технологии обработки слитной речи на естественном языке сегодня находятся в состоянии бурного развития. Растущий интерес исследователей и пользователей к этому технологическому сегменту очевиден: важная информация обсуждается на совещаниях, конференциях, форумах, Круглых столах, в ходе телефонных переговоров и «мозговых штурмов» именно в форме устных разговоров. В массивах исходных речевых записей накапливаются огромные объемы данных, связанных с обращениями клиентов в службы поддержки и отделы продаж компаний, которые необходимо анализировать и применять для повышения эффективности бизнес-процессов компании.
Автоматическое и точное выявление элементов записей, произнесенных различными людьми, идентификация конкретных дикторов по их голосам и распознавание их высказываний (преобразование в текст) – вот «три кита» современных научно-исследовательских и инженерных разработок в области речевых технологий, которые ведутся сегодня во всем мире. Их цель – автоматизировать процессы анализа больших объемов речевых записей для решения конкретных прикладных задач компаний и организаций. Важная составляющая этих работ – технологии сегментации речи по голосам отдельных людей, участвующих в разговоре (так называемая, диаризация дикторов). Она дает возможность точно выделить из многоголосной записи фрагменты, соответствующие различным дикторам, и повысить качество последующего анализа, например, идентификации человека по его голосу или распознавания произнесенных им слов.
Научно-исследовательская группа по обработке речи компании DSS Lab, которая является участником консорциума 3i Technologies, подтвердила высокий мировой уровень своих разработок, представив собственную технологию диаризации нового поколения.
«Технология 3i-Диаризация создана на основе уникального собственного математического аппарата компании DSS Lab, который позволил достичь высокой точности разделения речи дикторов по голосам, в сравнении с технологиями других производителей, даже в случае, когда в одной записи присутствует более двух голосов»,- поясняет Дмитрий Макаренко, заместитель генерального директора компании DSS Lab.
Технология 3i-Диаризация изначально создавалась для обработки сложных речевых сигналов. Например, таких, в которых встречаются дополнительные неречевые звуки, или дикторы обмениваются короткими фразами (с длительностью звучания менее секунды), или несколько человек говорят одновременно. Даже в этих условиях технология 3i-Диаризация обеспечивает высокую точность разделения речи дикторов. При этом не имеет значения, на каких языках эти дикторы говорят.
«Технологическое достижение компании DSS Lab в части диаризации речевых записей дает возможность значительно повысить эффективность существующих голосовых технологий компании, например, идентификации дикторов по образцам голоса, а также открывает перспективы дальнейшего совершенствования технологии применительно к различным ситуациям, например, для автоматической обработки записей дискуссий в студийной  обстановке,- подчеркивает Алексей Любимов, председатель Совета директоров консорциума 3i Technologies.- В результате консорциум 3i Technologies получает возможность создавать новые востребованные рынком ИТ-решения. В частности, объединение 3i-Диаризации с технологией полнотекстового поиска в больших объемах мультимедийных данных 3i Search позволит создавать прикладные ИТ-решения для оперативного анализа записей конференций, ТВ- и радио-программ, мультимедийных архивов и решения других задач аналитики информационного мультимедийного контента».

← Все новости

Rambler's Top100