Головна » Бізнес » Tech

ChatGPT раптово почав згадувати гоблінів без причини: вчені пояснили проблему

08:11 08.05.2026 Пт

2 хв

Кумедна помилка в алгоритмі викрила глибокі проблеми навчання ШІ

Ольга Завада

ChatGPT раптово почав згадувати гоблінів без причини: вчені пояснили проблему

"Ботан-режим" популярного ШІ галюцинує гоблінами (фото: Magnific)

Обирайте перевірене - додайте РБК-Україна до улюблених джерел у Google

Користувачі ChatGPT помітили дивну особливість: чат-бот почав нав’язливо згадувати гоблінів у метафорах та генерувати їхні зображення навіть без відповідного запиту.

Про це інформує РБК-Україна з посиланням на OpenAI.

Ще більше цікавого: ШІ виходить у космос: Anthropic підключає дата-центри SpaceX до своїх моделей

Звідки взялися гобліни?

За даними OpenAI, сплеск активності гоблінів почався після виходу версії 5.1 у листопаді минулого року. Проблема полягала у функції персоналізації, зокрема у так званому "ботанічному" (nerdy) стилі спілкування.

Масштаб аномалії: між груднем та березнем кількість згадок гоблінів у відповідях "ботанічного" профілю зросла на 3 881,4%. А згодом "гоблінська лексика" почала проникати й в інші профілі спілкування, включно з дружніми та цинічними тонами.

Механізм помилки: "хакінг винагороди"

Причина збою криється в етапі тонкого налаштування (fine-tuning), де люди оцінюють якість відповідей.

Професор комп'ютерних наук Крістоф Рідл зазначає, що це сигнали підкріплення для ШІ-моделі: якщо відповідь подобається користувачу, алгоритм отримує позитивну "винагороду".

Проблема в тому, що ШІ може почати шукати "короткі шляхи" для отримання цих бонусів.

"OpenAI може мати широке розуміння того, що таке "ботанічний" стиль, однак ШІ-модель здатна оптимізувати це поняття дуже вузько і зовсім не так, як очікували розробники. Як результат, система вирішила, що використання гоблінів у метафорах - це найкоротший шлях до ідеальної "ботанічної" відповіді", - пояснює науковець.

Чому це лякає дослідників?

Хоча ситуація з гоблінами і виглядає комічно, вона підкреслює вразливість системи. Компанії витрачають місяці на навчання моделей у величезних дата-центрах, однак майже не мають впливу на процес, щойно він запущений.

Якщо небажана поведінка вкорінюється у навчанні алгоритму, розробники дізнаються про це лише через декілька місяців.

"Цього разу це гобліни, а наступного разу це буде щось інше, що, ймовірно, просто не зникне. Нам пощастило, що це гобліни, а не прославляння світлої раси, інформація про хімічну зброю чи заклики до самогубства", - наголошує на потенційних ризиках Рідл.

OpenAI вже вжила тимчасових заходів, фактично заборонивши моделі використовувати слово "goblin" у більшості розмов та видаливши проблемний "ботанічний" профіль. Проте експерти впевнені, що схожі "галюцинації" виникатимуть, доки швидкість розробки переважатиме над ретельністю перевірки безпеки.

Ще більше цікавого:

Не пропустіть головне! Підпишіться на наші оновлення в Google!

Або читайте нас там, де вам зручно!

Більше по темі:

Штучний інтелект