Сегодня Google представил предварительную версию Gemini 2.5 Flash, которая доступна через API Gemini в Google AI Studio и Vertex AI. Эта новая версия значительно улучшает возможности reasoning, сохраняя при этом высокую скорость и низкие затраты. Gemini 2.5 Flash становится первым продуктом с гибридной моделью мышления, позволяя разработчикам включать или выключать процесс мышления в зависимости от задачи.
Модель предлагает пользователям настройку бюджета (thinking budget), что позволяет контролировать качество ответов, затраты и задержки. Даже с выключенным мышлением, модель сохраняет быструю производительность, стабильную для 2.0 Flash. Разработчики могут вручную установить, сколько информации обрабатывается во время размышлений, что открывает возможности для более глубокого анализа и решения сложных задач, от математических вопросов до составления расписания.
Например, при установке бюджета на 0, модель будет работать с минимальными затратами, но если задача требует большего анализа, бюджет может быть увеличен до 24,576 токенов. Gemini 2.5 Flash демонстрирует отличные результаты на сложных задачах, сохраняя конкурентное соотношение цена-производительность.
Для более подробной информации и руководств разработчиков загляните в документацию.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
