Підрозділ Google DeepMind анонсував просунуту версію своєї ШІ-моделі Genie 3, здатної генерувати тривимірні віртуальні світи в реальному часі. У таких світах можуть вільно переміщатися як користувачі, так і ШІ-агенти.
Про це повідомляє РБК-Україна з посиланням на американський веб-сайт про комп'ютерну техніку The Verge.
Це особливий тип ШІ, який створює симульовані простори - для навчання, розваг або тренувань інших ШІ, наприклад, роботів. Раніше такі віртуальні світи розроблялися вручну з використанням 3D-графіки, але тепер усе генерується нейромережею за простим текстовим описом.
Попередня версія Genie 2 могла підтримувати інтерактивність лише протягом 10-20 секунд. У новій моделі цей показник збільшився до кількох хвилин.
Навіть більше, у Genie 3 з'явилася візуальна пам'ять на рівні однієї хвилини. Це означає, що якщо користувач відвернеться від об'єкта, а потім повернеться до нього, - написи, кольори або предмети залишаться на тих самих місцях. Роздільна здатність згенерованого світу - 720p за частоти 24 кадри на секунду.
Genie 3 також підтримує так звані "програмовані події". Користувач може змінювати параметри світу в реальному часі - наприклад, викликати дощ, додати персонажів або змінити атмосферу, використовуючи текстові підказки (промпти).
Google активно розвиває напрямок генеративних світів. У грудні компанія показала Genie 2, яка вміла створювати ігрові сцени на основі одного зображення. Команду, що працює над цим проектом, очолює колишній співрозробник Sora - інструменту для генерації відео від OpenAI.
Вас може зацікавити: