OpenAI официально представила ChatGPT Images 2.0, обладающий значительными улучшениями в области генерации изображений с помощью ИИ. Эта версия, прошедшая обширные испытания под рабочим названием “duct tape” на платформе LM Arena AI, позволяет пользователям создавать сложные изображения, включая большие блоки текста, пользовательские интерфейсы и даже планы помещений.
Новая архитектура gpt-image-2 и функции “Thinking” для подписчиков ChatGPT представляют собой важный шаг в подходе OpenAI к визуальным медиа. Компания подчеркивает: “Изображения — это язык, а не украшение”, что говорит о стремлении видеть изображения как функциональные инструменты, а не просто визуальные элементы.
Хотя конкретные показатели производительности не были озвучены, OpenAI утверждает, что ChatGPT Images 2.0 работает на уровне “лучших из лучших”. Эта версия вышла на фоне усиливающейся конкуренции со стороны модели Google Nano Banana 2, выпущенной в феврале 2026 года. Ранние тесты демонстрируют, что новый продукт OpenAI может генерировать пользовательские интерфейсы и пакеты изображений с более высоким качеством по сравнению с конкурентами.
Команда OpenAI отменяет модель GPT-Image-1.5 как базовую, но оставляет её доступной через API, что говорит о доверии к новым возможностям. ChatGPT Images 2.0 теперь включает “O-серию” рассуждений, позволяя модели исследовать и планировать перед созданием изображений.
Во время демонстраций новый инструмент успешно создавал учебные материалы, включая карты древних империй с детальными подписями, что призвано помочь пользователям в создании информативного и визуально точного контента. Улучшения в типографии позволяют модели генерировать читаемый текст даже в сложных дизайнах и поддерживает создание изображений на нескольких языках, что устранит историческую предвзятость в ИИ.
Пользователи теперь могут создавать до восьми последовательных изображений из одного запроса, сохраняя последовательность и согласованность между выводами. Запуск включает структуру доступа по уровням: бесплатные пользователи могут использовать базовые функции, в то время как подписчики Plus и Pro получают доступ к более продвинутым возможностям, включая веб-поиск и генерацию нескольких изображений. Цены на API снижаются до $8.00 за вывод изображений.
OpenAI внедрила “многоуровневую систему” протоколов безопасности для обеспечения ответственного использования сгенерированных изображений, включая водяные знаки и фильтрацию контента. В ответ на вопросы о потенциальном злоупотреблении компания акцентировала внимание на важности мер безопасности в отношении политического влияния и рекламных кампаний.
Таким образом, ChatGPT Images 2.0 стремится переосмыслить взаимодействие между визуальной генерацией и намерением пользователя за счет улучшенного рассуждения и контекстуального понимания. Цель OpenAI — помочь пользователям выполнять экономически ценные творческие задачи, сочетая скорость и качество.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
