OpenAI готується до перезапуску ChatGPT, фокусуючись на розвитку Codex, агентних функцій і принципово нового голосового інтерфейсу. Перші згадки про нову аудіомодель GPT Bidi 1 уже виявлено у коді платформи.
Про це повідомляє РБК-Україна з посиланням на Testing Catalog.
За інформацією профільних експертів, обмежене коло користувачів застосунку ChatGPT уже отримало доступ до тестової версії моделі. Це вказує на можливий офіційний реліз найближчим часом.
Розробники роблять ставку саме на мовленнєвий інтерфейс, оскільки в OpenAI вважають голосову взаємодію найперспективнішим способом доступу користувачів до ШІ.
Нова модель покликана повністю ліквідувати технологічний розрив між просунутими текстовими архітектурами компанії та її застарілим голосовим шаром.
Абревіатура Bidi розшифровується як двонаправлений дизайн (bidirectional design). Ця архітектурна особливість дозволяє ШІ-асистенту водночас говорити, чути та аналізувати мовлення користувача.
У налаштуваннях додатка у селекторі моделей новий інструмент з'являється поруч зі стандартними та розширеними варіантами, а графічна бульбашка голосового інтерфейсу змінює колір на жовтий після активації GPT Bidi 1.
Головні функціональні зміни нової моделі:
Природне підтвердження сприйняття: ШІ може вставляти короткі репліки на кшталт "окей", коли користувач робить паузу або сповільнює мовлення, не перериваючи при цьому загальну канву бесіди.
Миттєве перемикання завдань: асистент здатний змінювати алгоритм дій "на льоту" - наприклад, якщо попросити його порахувати до десяти, а посеред процесу наказати рахувати у зворотному порядку, модель миттєво підлаштується під нові вказівки.
Однією з найважливіших переваг GPT Bidi 1 є здатність утримувати логіку тривалої розмови у межах єдиного контексту.
У попередніх версіях голосового стека ChatGPT тривале спілкування призводило до втрати ранніх фрагментів діалогу, що вважалося слабким місцем системи. Крім того, оновлений алгоритм більше не вклинюється у розмову передчасно під час тривалих пауз користувача.
Наразі OpenAI офіційно не анонсувала вихід моделі GPT Bidi 1 і не надав детальних специфікацій щодо наступної версії GPT 5.6. З усім тим, розгортання інтерфейсу серед перших тестувальників свідчить про фінальну стадію підготовки продукту до релізу.