Google Gemini научился превращать обычные фото в видео с озвучкой: как это работает
Google Gemini превращает снимки в видео со звуком (фото: Getty Images)
Компания Google представила новую функцию в своем ИИ-сервисе Gemini - теперь пользователи могут превращать обычные фотографии в короткие видеоролики с озвучкой.
Об этом сообщает РБК-Украина со ссылкой на американский сайт о компьютерной технике The Verge.
Детали обновления
Новинка основана на видеомодели Veo 3 и позволяет создавать восьмисекундные ролики из изображений, добавляя звуковое сопровождение, включая фоновые шумы, звуки окружающей среды и даже речь.
По данным Google, обновление уже доступно подписчикам Gemini AI Ultra и Pro в "отдельных регионах". На веб-платформе функция начала развертываться сегодня, а в мобильных приложениях появится в течение недели.
Чтобы воспользоваться возможностью, нужно нажать кнопку "tools" (инструменты) в строке ввода, выбрать "video", загрузить изображение и добавить текстовое описание того, как картинка должна "ожить". Можно также указать аудиодетали - от реплик до звуковых эффектов и атмосферы. Google утверждает, что звук будет "полностью синхронизирован с изображением".
Как воспользоваться новой функцией (фото: 9to5Google)
Итоговое видео формируется в формате MP4, с разрешением 720p и соотношением сторон 16:9. Все сгенерированные видео получают заметный водяной знак и невидимую цифровую метку SynthID, подтверждающую использование ИИ.
"Вы можете анимировать повседневные предметы, оживить рисунки или добавить движения к природным сценам", - отмечают в Google.
Подобный функционал уже есть в инструменте Flow - платформе для создания видео с помощью ИИ, представленной Google в марте. Теперь же пользователям Gemini не нужно открывать отдельное приложение - анимация доступна напрямую. Кроме того, Google расширяет доступ к Flow еще в 75 странах.
Вас может заинтересовать:
- OpenAI готовит собственный браузер с ИИ
- Google подключил Gemini к WhatsApp
- Google расширила доступ к Veo 3