Alibaba анонсировала мультимодальную модель ИИ Qwen2.5-Omni-7B

Китайская компания Alibaba Group Holding представила новую мультимодальную модель искусственного интеллекта Qwen2.5-Omni-7B, способную обрабатывать текст, изображения, аудио и видео прямо на мобильных устройствах. Это стало возможным благодаря гармоничному сочетанию 7 миллиардов параметров и уникальной архитектуры, которая обеспечивает высокую производительность на смартфонах и ноутбуках.

Модель, представленная 20 июня, оптимизирована для работы без постоянного интернет-соединения, что существенно ускоряет обработку данных и улучшает конфиденциальность. Qwen2.5-Omni-7B уже доступна в open-source формате на платформах Hugging Face, GitHub и ModelScope, а также интегрирована в чат-бот Qwen Chat.

Компания выделяет множество сценариев использования, включая поддержку слабовидящих людей и генерацию пошаговых руководств по приготовлению пищи. Alibaba уверена, что эта модель не только упрощает доступ к ИИ-технологиям, но и позволяет разработчикам создавать более эффективные и экономичные ИИ-агенты.