Ведущие ученые в сфере ИИ заявляют о тупике в исследовании классических чат-ботов. Новым технологическим фронтиром становятся так называемые модели мира, способные понимать законы физики и руководить роботами.
Об этом информирует РБК-Украина со ссылкой на Techxsplore.
По словам "крестной матери ИИ" Фэй-Фэй Ли, профессора компьютерных наук Стэнфордского университета, современные языковые модели способны изучить лишь статистическую структуру текста из книг, тогда как для ИИ критически важно научиться "читать окружение".
Скепсис относительно дальнейшего развития генеративного ИИ выражают многие мастодонты индустрии. В частности, Ян Лекун в прошлом году покинул пост главного научного сотрудника Meta по ИИ, чтобы возглавить новую парижскую лабораторию Advanced Machine Intelligence Labs, которая фокусируется именно на моделях мира.
Главная цель таких систем – научить ИИ прогнозировать последствия собственных действий в реальности.
"Ни один современный чат-бот не способен самостоятельно взять и поднять кофейную чашку. Это действие требует понимания геометрии пространства, динамики движения руки и физического контакта с поверхностью, что намного сложнее простого предсказания следующего пикселя или слова", - объясняет декан факультета компьютерных наук Университета Картиги.
Модели мира должны стать основой для "физического" или "воплощенного ИИ" (embodied AI), выполняя роль аналога человеческой нервной системы и спинного мозга, позволяющих телу мгновенно адаптироваться к изменениям окружающей среды.
Компьютерный ученый Луис Кастрикато, покинувший докторантуру в Брауновском университете ради основания стартапа Overworld, убежден, что индустрия прошла этап фундаментальных исследований LLM и теперь двигается в сторону интерактивности.
Его компания использует модели мира для создания трехмерных игровых пространств, которые адаптируются и трансформируются непосредственно при взаимодействии виртуального персонажа с объектами.
Несмотря на то, что термин "модель мира" быстро превращается в очередной модный термин маркетологов, Фэй-Фэй Ли попыталась упорядочить классификацию этих технологий, разделив их на три ключевые группы:
Визуализаторы (renderers) создают безупречную и реалистичную картинку виртуальных миров, но имеют низкую точность симуляции физики и несут мало пользы для обучения реальных роботов.
Симуляторы : виртуальные тренировочные полигоны, которые с высокой точностью воспроизводят реальную физическую структуру нашего мира.
Планировщики : наиболее коммерчески перспективные системы, способные предусматривать и планировать действия ШИ-агента или работа в неструктурированной и хаотической реальной среде.
Новая философия архитектуры ИИ уже привлекает значительные венчурные инвестиции. Фонды активно финансируют проекты Causal Labs (модели мира по прогнозированию погоды) и Extropic (разработка специализированных микросхем для моделей мира).
Инвесторы убеждены, что будущее технологий будет принадлежать не одной гигантской универсальной модели, а большому количеству разнообразных систем, оптимизированных для взаимодействия с физической реальностью.