Сегодня Google представила предварительную версию Gemini 2.5 Flash, которая доступна через Gemini API в Google AI Studio и Vertex AI. Эта версия строится на популярной модели 2.0 Flash и предлагает значительное улучшение в области рассуждений, сочетая скорость и экономичность.
Gemini 2.5 Flash — это первая полностью гибридная модель, позволяющая разработчикам включать или выключать процесс мышления. Модель предлагает возможность установить бюджет на размышления, что помогает находить оптимальный баланс между качеством, стоимостью и задержкой. Разработчики могут выбирать, сколько «мыслительных токенов» использовать для достижения наилучшего результата.
Новая система мышления позволяет модели обдумывать свои ответы, анализировать сложные задачи и планировать свои шаги. Это особенно полезно для многослойных задач, таких как решение математических задач или анализ исследований. Например, теперь моделям проще отвечать на сложные вопросы, такие как: «Сколько провинций в Канаде?» или «Какова вероятность, что сумма двух бросков кубиков будет равна 7?».
Gemini 2.5 Flash продолжает оставаться лидером по соотношению цена-качество. Наконец, модель готовится к полноценному коммерческому запуску, так что разработчики могут начать экспериментировать с новыми возможностями прямо сейчас.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
