图灵奖得主Sutton新作：AI的下一步，是走向“生成认知” 文章

36kr 资讯2026-06-02NEWSzh作者: 机器之心

摘要

从 LLM 的超长文本处理、视频生成模型的以假乱真、Agent 自主规划与执行的日趋成熟，到 VLA、世界模型等开始进入物理世界，AI 正在不断拓宽其能力边界。模型版本的迭代周期不断缩短，行业新闻与技术讨论的热度居高不下。在这样一往无前的氛围中，我们似乎离 AGI 近在咫尺。但一个疑问始终有待解答：这些服务器里的 AI，真的「理解」这个世界吗？或者说，它们展现出的智能，与生物在真实物理世界中生存所展现出的认知，在本质上是否同一？近期，学者 Banafsheh Rafiee 与强化学习之父 Richard S. Sutton 共同撰写了一篇论文，对当前主流人工智能（包括大语言模型、纯视觉模型乃至传统的符号系统）所依赖的「被动表征」路线进行了系统性的反思与批判，并将认知科学中的「生成认知」（Enactive Cognition）框架引入 AI 领域。该研究主张感知、认知和行动是相互建构的不可分割的整体，探讨了 AI 如何从依赖静态数据的被动信息处理系统，走向能够通过环境互动、具身行动与自我评估获得经验的智能体。论文标题：Toward Enactive Artificial Intelligence 世界本身就是它最好的模型当前相当一部分主流 AI 发展，仍然沿袭了一种被称为「表征主义」的经典观念。在传统人工智能范式中，无论是早期的符号系统，还是今天的深度学习模型，感知通常被理解为一种「先输入、再处理、后行动」的线性过程：系统先接收外部信号，再将这些信号加工成内部表征，随后基于这些表征进行推理和决策，最后输出动作。在这种观点下，智能系统就像一个中央处理器。它需要在内部构建一个尽可能精确的「世界副本」，感知是否成功，取决于这个内部模型能否准确还原外部现实。但 Rafiee 和 Sutton 指出，这种思路本身存在根本局限。真实世界是开放的、动态的、无限复杂的，没有任何一个有限的内部模型能够完整捕捉它的全部状态。世界并不是一组等待被编码的静态特征，而是一个会随着智能体的行动、上下文和互动历史不断变化的可能性空间。因此，论文引入了机器人学家 Rodney Brooks 的一句名言：「世界本身就是它最好的模型。」这句话的含义是，最可靠、最新鲜、最丰富的信息并不在智能体内部，而始终存在于外部世界之中。

图灵奖得主Sutton新作：AI的下一步，是走向“生成认知” 文章

摘要

相关事件

相关公司

相关人物查看全部 (3)

相关产品

相关技术查看全部 (15)