Google обновляет Gemini с новыми возможностями анализа окружения

Google начинает развертывание новых функций для Gemini, позволяющих анализировать окружение пользователя в реальном времени с помощью камеры устройства или экрана. Эти функции являются частью проекта Astra, а пользователи уже делятся опытом использования на Reddit.

Функция Gemini Live позволяет пользователям общаться с ИИ в реальном времени, используя естественный язык. Представитель Google подтвердил информацию о запуске этих возможностей, а также объявил о появлении «живого видео» и «обмена экраном» для подписчиков Google One Premium на устройствах Android.

В рамках дальнейшего развития Project Astra были анонсированы улучшения в диалогах и возможности работы с внешними инструментами. С выходом Gemini 2.0, включая Multimodal Live API, пользователи смогут получать советы, основанные на информации с экрана.

Добавленным к Gemini возможностям стали Audio Overviews и функции генерации и редактирования изображений. В свою очередь, новая модель Gemma 3 демонстрирует отличные результаты в сравнении с другими моделями на рынке. Тем временем Google представляет и новые инструменты, такие как Whisk Animate, которые нацелены на создание динамичного визуального контента.