Команда науковців з Університету штату Північна Кароліна (США) розробила інноваційну ШІ-платформу CHEEM, яка дозволяє вже навченим нейромережам безперервно освоювати нові завдання без зниження продуктивності.
Про це інформує РБК-Україна з посиланням на дослідження, опубліковане на сервері препринтів arXiv.
Як зазначив один із авторів дослідження Тяньфу Ву, головна мета проєкту CHEEM - навчити ШІ стабільної пам’яті та адаптивності, яких сучасним нейромережам все ще бракує.
"У світі технологій є дві серйозні проблеми. По-перше, якщо вже готовий ШІ спробувати навчити чомусь новому, він починає плутатися і значно гірше виконує ті завдання, які вмів робити спочатку. По-друге, чат-боти працюють неефективно: вони витрачають однакову кількість комп'ютерної енергії та часу як на вирішення складних наукових задач, так і на банальні короткі відповіді", - пояснює дослідник.
Новий метод дає алгоритму повну свободу дій і дозволяє йому самостійно перелаштовувати свою внутрішню структуру під час навчання:
Повторне використання досвіду: якщо нове завдання схоже на те, що нейромережа вже робила раніше, вона використовує свої старі напрацювання;
Створення нових блоків: коли задача є абсолютно новою та унікальною, програма самостійно добудовує додаткові цифрові шари для її вирішення;
Пропуск зайвих кроків: для виконання найпростіших повсякденних дій алгоритм ігнорує важкі ланцюжки обчислень, економлячи час та електроенергію.
Для перевірки технології вчені взяли за основу "передову та дуже складну" модель штучного інтелекту, яка працює з розпізнаванням зображень. Її протестували на спеціальних важких іспитах для комп'ютерних програм.
Результати перевершили очікування вчених: система з алгоритмом CHEEM виконувала нові завдання майже так само добре, якби її з самого початку тренували лише під одну цю конкретну справу. При цьому вона не забула свої минулі функції.
Офіційна презентація наукової розробки відбудеться на профільній міжнародній конференції комп'ютерного зору, яка проходитиме з 3 по 7 червня у Денвері
Наразі автори проєкту шукають технологічних партнерів, які нададуть потужні суперкомп'ютери для тестування технології на гігантських ШІ-системах із мільярдами параметрів.