Google представила новую версию своей модели искусственного интеллекта Gemini 2.0 Flash, которая теперь доступна для экспериментирования разработчиками по всему миру. Эта модель объединяет мультимодальный ввод, улучшенное мышление и понимание естественного языка для создания изображений.
Одной из интересных функций является возможность рассказывать истории: Gemini 2.0 Flash иллюстрирует сказанное, поддерживая согласованность персонажей и настроения. Модель также позволяет редактировать изображения через диалог, что делает процесс творчества более интерактивным и настраиваемым.
В отличие от многих других генераторов изображений, Gemini 2.0 Flash использует мировые знания и улучшенное рассуждение, что помогает создать более реалистичные изображения, например, для рецептов или рекламных материалов. Тесты показывают, что эта модель показывает лучшие результаты в плане форматирования текста и отображения деталей.
Разработчики могут начать пользоваться возможностями Gemini 2.0 Flash через API, и Google с нетерпением ждет их обратной связи для дальнейшего улучшения продукта. Эта новая технология может значительно упростить создание приложений с богатой графикой и интерактивными функциями.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
