20 мая 2025 года, команда Google объявила о расширении возможностей своей модели Gemini. С помощью этой новинки искусственный интеллект сможет принимать решения и представлять новые впечатления, моделируя аспекты реального мира. На протяжении последнего десятилетия компания разработала ключевые технологии для создания современных моделей AI, включая архитектуру Transformer и системы агентов, умеющих обучаться и планировать.
Новое направление работы — превращение Gemini 2.5 Pro в мировую модель, которая понимает и воспроизводит окружающую среду, подобно человеческому мозгу. Ранее Gemini уже проявлял способности к моделированию природных условий и задач, применяя знания и логическое мышление. Визуальный интеллект также улучшился, что позволит пользователям взаимодействовать с 3D-симуляциями на основе простых изображений.
Основная цель — создать универсального AI помощника, который будет способен управлять повседневными задачами и улучшать качество жизни пользователей. Среди новых функций ожидается видео понимание, поддержка экранного обмена и возможность управления компьютером с помощью голоса. Испытания новых функций проходят с помощью группы доверенных тестеров, что поможет улучшить пользовательский опыт.
Как часть этой работы, проект Mariner позволит AI выполнять до десяти различных задач одновременно, таких как поиск информации, бронирование и даже покупки. Это большая веха на пути к созданию более личного и активного AI, который действительно изменит нашу жизнь к лучшему.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
