Недавно был представлен новый режим Expressive Mode, который позволяет голосовым ботам управлять интонацией и эмоциональной окраской своей речи.
Теперь бот может адаптироваться к собеседнику в реальном времени: говорить мягче и спокойнее в напряжённых ситуациях или, наоборот, добавить уверенности и темпа, когда необходимо донести информацию максимально чётко.
Это обновление основано на двух ключевых компонентах. Первый – новая TTS-модель Eleven v3 Conversational, которая оптимизирована для диалогов, сохраняя контекст беседы и избегая механического звучания. Второй компонент – улучшенная система смены очереди говорящего.
Благодаря анализу данных транскрибации, ИИ может точнее определять подходящие моменты для вступления в разговор и делать паузы, что решает проблему с перебиванием, распространенную среди голосовых ботов. Новый режим поддерживает более 70 языков.
Делегируйте рутинные задачи с BotHub! Для доступа к сервису не требуется VPN, и можно использовать российскую карту. Получите 300 000 бесплатных токенов для первых задач и начните работать с нейросетями прямо сейчас!
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
