3i VOX TTS | Синтез речи
Озвучивайте тексты и контент.
Используйте для роботов, обзвона и голосовых меню.
Создайте свой уникальный голос для любых задач.

Синтезируйте высококачественные голоса для любых задач

Голосовые боты
Ассистенты в приложениях
IVR
Озвучка медиаконтента
Озвучка курсов и презентаций
Системы оповещения
Преимущества
Cloud | On-premise
Возможность использовать как облачный сервис или развернуть ПО на своих GPU-серверах.
Реалистичные голоса
Высококачественный синтез речи на базе нейросетевой архитектуры Tacotron2 и WaveNet
Brand Voice
Поможем создать уникальный голос для озвучки фирменного контента в любых каналах
Высокая скорость
Минимум пауз и задержек при озвучке для более реалистичного диалога.
Управление произношением
Управляйте скоростью, паузами и интонацией. Расставляйте акценты для достижения наилучшего звучания.
API
Поддержка REST API и gRPC.
Простая интеграция по протоколу HTTP/HTTPS

Технические особенности

Поддерживаемые голоса и языки
  • Русский язык: мужской, женский
Минимальные аппаратные требования для On-premise
  • 2-х CPU (2 физических ядер) с частотой 2.4 GHz
  • GPU NVIDIA с поддержкой CUDA и объемом ОЗУ не менее 8 ГБ
  • 8 ГБ ОЗУ
  • 30 ГБ дискового пространства
Технические требования
  • 64-х разрядная операционная система на базе Linux (CentOS не ниже 7.X, Debian не ниже 10.x , Astra Linux не ниже 1.7)
  • docker, nvidia-docker, docker-compose
  • драйвер cuda версии 10.2+
Формат выходных данных
−     частота дискретизации 22050 Гц
−     кодек pcm_s16le
−     количество каналов 1

Обсудим проект?
Оперативно свяжемся с Вами и ответим на любые вопросы
Ваши контакты:
Нажимая кнопку "Отправить", Вы даете согласие на обработку Ваших персональных данных и соглашаетесь c политикой конфиденциальности.