В мире робототехники открываются новые горизонты с представлением моделей Gemini Robotics от Google DeepMind, которые основаны на Gemini 2.0. Эти модели позволяют роботам действовать более эффективно благодаря технологиям многомодального мышления, совмещающим текст, изображения, аудио и видео.
Запущено два основных продукта: Gemini Robotics, обладающий способностью контролировать физические действия роботов, и Gemini Robotics-ER, который акцентируется на пространственном восприятии, что даст возможность разработчикам запускать свои программы.
По сути, эти модели переводят ИИ в физический мир, предоставляя роботам возможность правильно реагировать на окружающую среду. Это включает в себя общение с людьми и адаптацию к изменениям обстановки. Gemini Robotics уже продемонстрировала выдающиеся результаты при выполнении задач, требующих высокой точности, например, складывание оригами или упаковку вещей.
Повышенная безопасность также является важной частью их разработки: новые подходы помогут обеспечить защиту как для роботов, так и для людей, с ними взаимодействующих. Следующая волна полезных роботов постепенно становится реальностью.
