Китайская лаборатория MiniMax представила M3 — открытую мультимодальную модель

Китайская лаборатория MiniMax анонсировала новую модель M3, которая поддерживает контекст до миллиона токенов и предназначена для программирования и автономных задач. Это мультимодальная модель, обрабатывающая текст и изображения совместно, что позволяет ей эффективно решать сложные задачи. Например, на бенчмарке SWE-Bench Pro модель показала 59,0%, а на тесте BrowseComp достигла 83,5%, опередив Claude Opus 4.7.

M3 использует уникальную архитектуру MiniMax Sparse Attention, что позволяет обрабатывать длинный контекст с высокой эффективностью, а также внедрять агентные сессии и анализировать длинные видеопотоки. Стоимость использования модели остается доступной, что делает её привлекательной для разработчиков. За семь дней после запуска предоставляется скидка 50% на услуги.

Помимо этого, M3 уже демонстрирует отличные результаты в выполнении сложных задач, таких как воспроизведение научных статей и оптимизация вычислительных процессов. В дальнейшем ожидается публикация весов и технического отчета на HuggingFace и GitHub.

*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена