Компания Google DeepMind анонсировала свой новый проект под названием Gemini Robotics, основанный на модели Gemini 2.0. Эта разработка призвана воплотить возможности AI в реальном мире, позволяя роботам не только понимать, но и эффективно взаимодействовать с окружающей средой. Gemini Robotics включает в себя модель VLA (vision-language-action), которая обладает возможностью выполнять физические действия, значительно расширяя спектр задач, решаемых роботами.
Второй компонент, Gemini Robotics-ER, ориентирован на пространственное понимание, что позволяет роботам проводить сложные операции с высоким уровнем детализации и взаимодействовать с пользователями на естественном языке. Например, модель может автоматически планировать действия, избегая столкновений и адаптируясь к изменениям в среде.
Ожидается, что с этими нововведениями роботы станут более универсальными и полезными помощниками в нашей повседневной жизни. Компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена.
