На конференции разработчиков Google I/O 2025 была представлена новая версия системы генерации видео от Google — Veo 3. Это AI-модель способна не только создавать фотореалистичное видео по текстовому запросу, но и генерировать синхронизированный звук, что до этого момента оставалось одним из больших вызовов в индустрии.
Теперь, если вы запросите видео, например, в переполненном вагоне метро, Veo 3 не только визуализирует картину, но и добавит фоновый шум и звуки голосов, что значительно увеличивает реализм.
Модель также умеет имитировать физику реального мира и синхронизацию губ, что может стать важным инструментом для кинематографистов. Доступ к Veo 3 сейчас открыт для подписчиков Gemini Ultra в США.
Следует отметить, что создание AI-моделей, которые могут одновременно генерировать видео и аудио, — это сложная задача, требующая значительных вычислительных мощностей. Это открывает новые горизонты для творческих индустрий и подчеркивает амбиции Google по внедрению AI в различные области.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
