Вчені помилялися: чому ідея спільного ШІ-розуму не працює
(фото: Magnific)
Два роки тому науковці з Массачусетського технологічного інституту (MIT) сколихнули світ сміливою теорією: чим потужнішими стають ШІ-моделі, тим вони симетричніші у своєму баченні світу. Проте свіже дослідження вчених Федеральної політехнічної школи Лозанни (EPFL) повністю спростувало цю ідею, довівши, що реальність значно складніша.
Про це пише РБК-Україна з посиланням на наукове дослідження, опубліковане на сервері препринтів arXiv.
Крах Платонівської гіпотези та математична пастка
У 2024 році вчені з MIT висунули так звану "Платонівську гіпотезу представлення". Вони стверджували, що незалежно від типу даних (текст, відео, аудіо чи зображення), усі просунуті ШІ-системи поступово приходять до однакової внутрішньої структури розуміння реальності - ніби відкривають універсальні "ідеальні форми" Платона.
Ідея базувалася на високих індексах схожості під час порівняння цифрових векторів таких понять, як "собака", "дерево" чи "автомобіль".
Проте команда з Лабораторії машинного навчання для біомедицини EPFL вирішила перевірити ці розрахунки й виявила оптичну ілюзію, яка ховалася в аномальній математиці багатовимірних просторів.
У чому полягала помилка?
Концентрація відстаней. У надскладних нейромережах діють специфічні закони геометрії. Там навіть абсолютно непов'язані між собою випадкові точки з часом опиняються на майже однаковій відстані одна від одної.
Парадокс порожніх моделей. Коли дослідники EPFL порівняли дві абсолютно випадкові, "сирі" ШІ-моделі, які ніколи не проходили навчання й не освоювали жодних даних, метрики все одно показали високий рівень схожості.
Масштабний обман. Виявилося, що зі збільшенням розміру нейромереж показники схожості автоматично зростають через суто математичні причини, а не тому, що ШІ починає краще розуміти світ.
Нова теорія: чому Арістотель переміг Платона
Результати детального аналізу змусили вчених відмовитися від ідеї глобального злиття світоглядів ШІ. Замість цього вони запропонували нову "Арістотелеву гіпотезу представлення".
Пояснення:
Якщо Платон шукав абсолюти, то його учень Арістотель фокусувався на контексті, категоріях і зв'язках. Експерименти довели, що нейромережі дійсно демонструють схожість, але тільки на локальному рівні.
Тобто різні ШІ однаково розуміють, які об'єкти мають бути поруч (наприклад, вантажівка буде знаходитися в одному кластері з легковиком, а кішка - з собакою). Проте глобальна геометрія простору та загальна логіка мислення у кожної моделі залишаються унікальними та радикально відрізняються.
Пояснення Аристотелівської гіпотези (схема: arXiv)
Що це означає для майбутнього технологій?
Наукова суперечка може здатися надто абстрактною, проте вона має колосальне практичне значення для розробників. Раніше інженери сподівалися, що якщо всі потужні ШІ з часом почнуть мислити однаково, їх буде дуже легко об'єднувати між собою, створювати мультимодальні системи (де текст і зір працюють як одне ціле) та контролювати їхню безпеку.
Тепер зрозуміло, що єдиного універсального коду мислення не існує.
Розробникам доведеться створювати абсолютно нові інструменти для вирівнювання і синхронізації різних ШІ, враховуючи їхні фундаментальні відмінності.
Автори оригінальної теорії з MIT уже визнали правоту швейцарських колег, назвавши це відкриття важливим проривом для комп'ютерних наук.