Стартап Stability AI представил модель Stable Audio Open Small, предназначенную для создания стерео звука. Эта модель, по утверждениям компании, является одной из самых быстрых на рынке и подходит для работы на смартфонах. Разработка стала возможной благодаря сотрудничеству Stability AI с Arm, известным производителем микросхем.
Stable Audio Open Small имеет 341 миллион параметров и оптимизирована для процессоров Arm. Она может генерировать до 11 секунд аудио всего за 8 секунд, что делает её невероятно полезной для быстрого создания коротких аудиосэмплов и звуковых эффектов.
Важно отметить, что обучающий набор модели основан на свободных аудиобиблиотеках, что минимизирует риски нарушения авторских прав. Тем не менее, Stable Audio Open Small поддерживает только английский язык и имеет ограничения на использование, особенно для коммерческих целей. Модель бесплатна для исследователей и малых компаний, но для организаций с доходом выше 1 миллиона долларов требуется корпоративная лицензия.
Тем не менее, Stable Audio Open Small все еще имеет свои недостатки, включая трудности с генерацией высококачественного вокала и ограниченную способность к работе в различных музыкальных жанрах. Однако развитие технологий ИИ открывает новые горизонты, и эта модель является шагом в правильном направлении.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
