ИИ не понимает людей: эксперимент ученых выявил критическую слабость нейросетей
ИИ научился видеть опасность лучше людей, однако не самих людей (фото: Magnific)
Исследователи из Корнелльского университета в США провели уникальное тестирование современных мультимодальных ИИ-моделей (VLM), пытаясь научить роботов социальному интеллекту. Эксперимент показал, что ИИ прекрасно прогнозирует физические катастрофы, однако категорически не способен считывать эмоции и мимику людей, которые за этим наблюдают.
Об этом пишет РБК-Украина, ссылаясь на исследование ученых, опубликованное в ACM Digital Library.
Эксперимент с хаосом: малыш, газонокосилка и гуманоид
Цель ученых заключалась в том, чтобы предоставить будущим домашним и промышленным роботам способность понимать социальные навыки - считывать взгляды, угадывать намерения и предвидеть потребности людей без слов.
Для этого ученые использовали базу коротких напряженных видеороликов. Среди сюжетов были:
- малыш, который несет слишком полную чашку горячего кофе;
- мужчина, мчащийся на бешеной скорости на газонокосилке;
- робот-гуманоид, который пытается перепрыгнуть между высокими блоками.
Ученые протестировали шесть ведущих моделей компьютерного зрения и речи. Среди них были как гиганты с закрытым кодом (OpenAI GPT-4o, Google Gemini 2.0 Flash), так и перспективные бесплатные системы с открытым кодом (в частности DeepSeek).
Тестирование проходило в два этапа:
Сначала модели анализировали непосредственно сами действия на видео и пытались угадать, чем закончится сцена - успехом или аварией.
Затем ИИ показывали видео или фотографии лиц людей, которые смотрели эти же ролики, и просили сделать прогноз катастрофы чисто по человеческой мимике (на основе испуга, закрытых глаз или улыбки).
Читайте больше: ИИ научился создавать вакцины против COVID-19: что показали первые испытания на людях
Результаты: эмпатия проиграла математике
Во время прямого анализа видео ИИ показал исключительные результаты.
Лучшая открытая модель предсказала финал с точностью 70%, а лидер среди закрытых систем выдал результат в 63% - это полностью соответствует или даже превышает уровень внимательности среднестатистического человека. ИИ легко понял законы физики и угрозу от ситуаций.
Но как только задачу изменили и заставили модели думать "через призму людей", система полностью сломалась.
Точность прогнозов, основанных только на выражениях лиц очевидцев, обвалилась до критических 44,5-53,5%. Некоторые мощные нейросети вообще начали выдавать идентичный стандартный ответ для каждого лица, независимо от того, был ли человек шокирован или спокоен.
По словам ведущего автора исследования Марии Терезы Паррейры, результаты которой официально презентовали на Международной конференции по взаимодействию людей и роботов (HRI 2026) в Эдинбурге, это свидетельствует о серьезном дефиците социального интеллекта у современного ИИ.
"Роботы не понимают невербальных сигналов, которые люди излучают при контакте с миром", - подчеркнула ученая.
Почему роботам нужно позволить ошибаться?
Профессор Корнелла Венди Джу считает, что результаты тестов указывают на глобальную ошибку современной инженерии. Большинство лабораторий пытается годами держать роботов в четырех стенах, стремясь довести их до вымышленного идеала, и только потом обнародует результаты своих исследований.
"Когда они наконец испытывают их в реальной жизни, то всегда удивляются тому, как сильно контекст отличается от лабораторного и как непредсказуемо реагируют люди", - отметила Венди Джу.
"Роботы должны учиться непосредственно "на работе" - работать среди нас еще до того, как станут идеальными, "видеть" собственные ошибки, адаптироваться к человеческим эмоциям и менять свой софт в процессе живого взаимодействия", - добавила она.
Сейчас команда ученых планирует выяснить точные причины "слепоты" ИИ к человеческой мимике и изменить алгоритмы обучения подсказок для нейросетей.