OpenAI оголосила про реліз Images 2.0, назвавши його "ренесансом" цифрового мистецтва. Новий інструмент, вбудований безпосередньо у ChatGPT, пропонує два режими роботи - швидкий Instant та інтелектуальний Thinking.
Про це пише РБК-Україна з посиланням на Gizmodo.
Генеральний директор OpenAI Сем Альтман порівняв попередні креативні ШІ-моделі, включно з Dall-e, із "давнім мистецтвом". Він заявив, що Images 2.0 - це "стрибок, подібний до переходу від GPT-3 відразу до GPT-5".
Покращена точність: ШІ-модель стала уважнішою до деталей. Так, вона здатна згенерувати тарілку з рисом, де лише на одному зернятку буде написано назву нейромережі.
Новий рівень зображень від Images 2.0 (фото: OpenAI)
Рідкісні помилки: розробники стверджують, що друкарські помилки у тексті на зображеннях стали "вкрай рідкісними" - це вважалося однією з головних проблем попередніх поколінь.
Багатомовність: Images 2.0 краще розуміє складні запити різними мовами та демонструє вищий рівень візуального інтелекту.
Головною інновацією стала поява режиму Thinking, доступного лише платним передплатникам (Plus, Pro та Business).
Що пропонує нова функція:
Складну генерацію: режим дозволяє створювати цілі сторінки манги з повторюваними персонажами та динамічною сюжетною лінією.
Самоперевірку: ШІ може здійснювати пошук в інтернеті для актуалізації даних та "двічі перевіряти" власні результати перед фінальною демонстрацією користувачу.
Мультигенерацію: створення кількох різних зображень на основі одного короткого промпту.
Для звичайних користувачів та через API вже доступний режим Instant - швидша та модернізована версія стандартного ШІ-генератора.
Реліз Images 2.0 відбувається у критичний момент для OpenAI. Компанія досі далека від прибутковості, попри величезні витрати, і зараз активно готується до IPO.
З якими проблемами стикається техностартап:
Конкуренція з Google. Після успіху Google Gemini 3 та оновлення Nano Banana Pro OpenAI оголосила внутрішній "червоний код". Новий ШІ-генератор має стати головним козирем у боротьбі нейронок.
Ставка на фотореалізм. Дослідники компанії сподіваються на віральність контенту у соцмережах, принаймні таку, як минулорічний хайп навколо "стилю Студії Гіблі".
Фінансові маневри. Щоб задобрити інвесторів, OpenAI перетворилася на "комерційну корпорацію суспільного благополуччя" та навіть тимчасово відклала реліз відеогенератора Sora. Ціль - скорочення витрат.
Примітно, що вже у лютому цього року кількість щотижневих активних користувачів ChatGPT сягнула 900 мільйонів. В OpenAI розраховують, що завдяки Images 2.0 ця цифра подолає позначку в 1 мільярд найближчим часом.