摘要
从 LLM 的超长文本处理、视频生成模型的以假乱真、Agent 自主规划与执行的日趋成熟,到 VLA、世界模型等开始进入物理世界,AI 正在不断拓宽其能力边界。 模型版本的迭代周期不断缩短,行业新闻与技术讨论的热度居高不下。在这样一往无前的氛围中,我们似乎离 AGI 近在咫尺。 但一个疑问始终有待解答:这些服务器里的 AI,真的「理解」这个世界吗?或者说,它们展现出的智能,与生物在真实物理世界中生存所展现出的认知,在本质上是否同一? 近期,学者 Banafsheh Rafiee 与强化学习之父 Richard S. Sutton 共同撰写了一篇论文,对当前主流人工智能(包括大语言模型、纯视觉模型乃至传统的符号系统)所依赖的「被动表征」路线进行了系统性的反思与批判,并将认知科学中的「生成认知」(Enactive Cognition)框架引入 AI 领域。 该研究主张感知、认知和行动是相互建构的不可分割的整体,探讨了 AI 如何从依赖静态数据的被动信息处理系统,走向能够通过环境互动、具身行动与自我评估获得经验的智能体。 论文标题:Toward Enactive Artificial Intelligence 世界本身就是它最好的模型 当前相当一部分主流 AI 发展,仍然沿袭了一种被称为「表征主义」的经典观念。 在传统人工智能范式中,无论是早期的符号系统,还是今天的深度学习模型,感知通常被理解为一种「先输入、再处理、后行动」的线性过程:系统先接收外部信号,再将这些信号加工成内部表征,随后基于这些表征进行推理和决策,最后输出动作。 在这种观点下,智能系统就像一个中央处理器。它需要在内部构建一个尽可能精确的「世界副本」,感知是否成功,取决于这个内部模型能否准确还原外部现实。 但 Rafiee 和 Sutton 指出,这种思路本身存在根本局限。真实世界是开放的、动态的、无限复杂的,没有任何一个有限的内部模型能够完整捕捉它的全部状态。世界并不是一组等待被编码的静态特征,而是一个会随着智能体的行动、上下文和互动历史不断变化的可能性空间。 因此,论文引入了机器人学家 Rodney Brooks 的一句名言:「世界本身就是它最好的模型。」 这句话的含义是,最可靠、最新鲜、最丰富的信息并不在智能体内部,而始终存在于外部世界之中。
相关事件
暂无数据
相关公司
暂无数据
相关产品
暂无数据