OpenAI представляет новый режим Images 2.0 в ChatGPT для создания изображений

Компания OpenAI анонсировала новый режим работы Images 2.0 в своём ИИ-агенте ChatGPT. Этот режим, оформленный как «размышление», позволяет создавать высококачественные научные графики и детализированные изображения. В отличие от предыдущих версий, Images 2.0 использует больше времени на анализ запросов и поиск информации в интернете, что повышает реалистичность создаваемых картинок.

Теперь модель может генерировать изображения с разрешением до 2K и выполнять жёсткие стилистические ограничения, что будет полезно для преподавателей и учёных. Новая система также поддерживает мультиязычность, включая генерацию иероглифов и сложных шрифтов для языков, таких как японский, корейский и китайский.

Ключевым нововведением является возможность создания до восемь изображений за один раз и реализация поиска актуальных референсов в интернете. Однако стоит отметить, что Images 2.0 ещё допускает ошибки в создании сложных схем и мелких элементов.

Также были отмечены успехи других компаний: Midjourney анонсировала модель V7, Google внедрила генератор Nano Banana, а Meta* разрабатывает модель Mango, предназначенную как для изображений, так и коротких видеороликов.

*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена