Дослідники з Корейського передового інституту науки і технологій (KAIST) представили новий метод навчання нейромереж, який робить їхні прогнози значно надійнішими. Новий підхід дозволяє ШІ видавати прагматичні оцінки впевненості у власних відповідях.
Про це пише РБК-Україна з посиланням на дослідження науковців, опубліковане у фаховому віснику Nature Machine Intelligence.
Вчені пояснюють: більшість сучасних ШІ-систем використовує глибинне навчання на базі багатошарових нейронних мереж. Під час роботи вони видають не лише відповідь, а й оцінку впевненості у її точності.
Однак практика показує, що ШІ часто допускає помилки, видаючи їх за доведений факт із високим показником імовірності.
За словами дослідників Чонхвана Чхона та Се-Бум Пайка, причиною цієї проблеми є стандартний метод ініціалізації моделей (ряд дій, що передують виконанню програми), який тривалий час вважався еталонним. Саме він закладає основу для подальшої надмірної впевненості системи.
Щоб виправити цей недолік, науковці розробили стратегію "розминки", натхненну розвитком людського мозку.
Процес виглядає так:
Навчання на шумі: перед початком роботи з реальними даними нейромережу коротко тренують на випадковому шумі (даних без логічних патернів) та довільних результатах.
Калібрування: під час цієї фази мережа вчиться не шукати закономірності там, де їх немає - якраз це і формує правильне "розуміння" ШІ поняття невизначеності.
Основне навчання: лише після такої підготовки модель починає вивчати специфічні завдання на реальних датасетах.
Дослідники зазначають: порівняння зі стандартними методами виявилося "вражаючим". Моделі, що пройшли "розминку", значно краще ідентифікували невідомі вхідні дані та видавали низькі бали впевненості для своїх помилкових прогнозів. При цьому вони зберігали високу впевненість лише у правильних відповідях.
Вчені KAIST акцентують: головна перевага нового підходу полягає у його простоті. Він не потребує складного інженерного втручання чи додаткової обробки даних після навчання. Достатньо лише короткої підготовчої сесії перед початком основного тренування алгоритму.
У перспективі це допоможе створити безпечніші системи ШІ для діагностики захворювань, де помилкова впевненість може призвести до неправильного лікування, або для систем автопілота, де неточна оцінка ситуації на дорозі загрожує аваріями.
Вчені планують розвивати новаторський метод, щоб застосувати його до ширшого спектра ШІ-моделей у реальних ситуаціях по всьому світі.