你的AI Agent越用越蠢?港中大、浙大戳破“记忆”的谎言 文章

36kr 资讯2026-05-19NEWSzh作者: 新智元

摘要

你有没有遇到过这种情况: 给Agent配了向量数据库,上传了大量历史对话,结果它下次还是答不上来;或者用Cursor、Claude写了几十轮代码,感觉它对你项目的理解并没有随着时间真正加深,每次都像是在重新认识你。 这不是模型的问题,也不是RAG配置的问题。 香港中文大学与浙江大学的研究者在一篇新论文中给出了一个更根本的答案:我们根本就没有给Agent真正的记忆。我们只是给了它一个备忘录(Memo)。 论文链接:https://arxiv.org/pdf/2604.27707 论文于2026年4月30日在arXiv发布预印本,约10天之内便在国际学术社区引发大量讨论。AI领域知名账号 @dair_ai 在X(Twitter)的转发获得超过26,100次浏览与700余次点赞,多位YouTuber亦自发制作了介绍视频,小红书上也有多篇转载。 01 Agent为什么越用越蠢? 当前主流的Agent记忆方案,大体可以分为四类:向量存储、检索增强生成(RAG)、便签本(Scratchpad)与上下文窗口管理。 它们有一个共同点:都是「查找」,而非「记忆」。 论文作者将这类机制统称为「备忘录(Memo)」,而非真正意义上的记忆(True Memory)。 备忘录的逻辑是:把信息存起来,用的时候再检索出来。这和人类把一件事「记在心里」,是完全不同的两件事。 这个区别的核心在于泛化机制的本质差异: 基于检索的记忆:通过与存储案例的相似性进行泛化。如果你存的案例里没有类似的情境,Agent就不会处理。 基于权重的记忆:将经验抽象成规则,并将规则应用于从未见过的输入。 人类在学习一门语言时,不是把每一个句子都背下来,而是内化了语法规则,然后能造出从没说过的新句子。 目前的Agent「记忆」,更像是基于检索的记忆。 02 三大结构性缺陷 作者归纳出当前上下文代理记忆系统的三个关键局限,且每一个都可以在理论层面被证明,而非仅凭直觉。 缺陷一:信息量不等于能力 Agent会无限积累笔记,却无法发展出真正的专业知识。 认知科学早已证明(Chi et al., 1981),人类专家与新手的根本区别不在于掌握了更多信息,而在于知识的组织方式发生了质变:专家的知识按照深层原则重新结构化,而非简单堆积。