Новые эксперименты с ИИ-агентами: как науки о сознании встречаются с технологиями

Исследователь Инь Цзюнь Пхуа из Токийского института науки применил подход, называемый “синтетической нейрофеноменологией”, для создания ИИ-агентов, которые воплощают три ведущие теории сознания. Это позволяет проводить эксперименты, которые невозможно осуществить на живом мозге. Агенты выступают в роли “идеальных модельных организмов”, где можно наблюдать и изменять каждый нейрон.

Первый эксперимент проверял гипотезу высшего порядка (HOT) о том, что сознание требует самомониторинга. Когда агенту отключили модуль “Я-модели”, его способность оценивать уверенность резко упала, хотя выполнение задач осталось на уровне 88%.

Второй эксперимент протестировал теорию глобального рабочего пространства (GWT). Агент с трудом справлялся с задачей, когда “рабочая шина” была отключена, подтверждая, что GWT критически важна для доступа к информации.

Третий эксперимент показал, что GWT-архитектура может усиливать шум, обостряя уязвимость, когда система без фильтрации информации работать хуже.

Это серьезные выводы для разработчиков ИИ: без системной метакогнитивной калибровки агенты не смогут правильно сообщать о своей уверенности, что критично для безопасных приложений, таких как беспилотники и медицинские ИИ.

*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена.