Флагманская Text-to-Speech модель Eleven v3 официально вышла из стадии альфа-тестирования и стала доступной для коммерческого использования. Основной акцент в финальной версии сделан на точности интерпретации сложных данных, что критично, когда чтение символов зависит от контекста.
Компания ElevenLabs продолжила совершенствовать модель после альфа-версии. В результате, пользователи в 72% случаев предпочли новую версию, отмечая её стабильную работу и улучшенную точность обработки чисел и символов на разных языках. Например, номер телефона «+49 170 9876543» теперь озвучивается верно, а не как множество чисел.
Модель была протестирована в рамках внутреннего бенчмарка, охватывающего 27 категорий на 8 языках. В то время как Eleven v3 демонстрирует впечатляющие результаты, системы преобразования текста в речь по-прежнему сталкиваются с вызовами интерпретации в различных контекстах. Следите за этим прогрессом!
*Компания Meta Platforms Inc. признана экстремистской организацией, её деятельность на территории России запрещена.
