Китайский гигант Alibaba представил новое семейство открытых ИИ-моделей Qwen3, в которое входят различные варианты с разным числом параметров – от 0.6B до флагманской модели в 235 миллиардов параметров. Эта модель может работать локально и эффективно справляется с математическими и программными задачами, обгоняя некоторые из моделей OpenAI и Google. Однако на фоне новой модели OpenAI o4-mini Qwen3 не дотягивает, показывая результат 70.7% по сравнению с 80% у o4-mini на LiveCodeBench.
Интересно, что Qwen3 имеет специальные режимы: ‘мыслящий’ для сложных задач и ‘немыслящий’ для быстрых ответов. Разные размеры моделей также делают их доступными для использования на обычных устройствах, таких как iPhone.
Дополнительно, компания Mistral представила новую открытую языковую модель Devstral с 24 миллионами параметров, специально разработанную для разработки ПО, что позволяет её запускать даже на ноутбуках. Devstral поддерживает локальную работу и имеет лицензию Apache 2.0, что открывает широкий спектр возможностей для разработчиков.
Таким образом, Qwen3 и Devstral подчеркивают растущую конкурентоспособность в экосистеме открытых ИИ-моделей.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
