双榜SOTA,微软ACL2026新作重新定义AI长记忆 文章

36kr 资讯2026-05-27NEWSzh作者: 量子位

摘要

随着大语言模型在各类应用中加速落地,一个核心技术瓶颈日益凸显——AI始终缺乏真正的长期记忆能力。当前主流的RAG(检索增强生成)方案依赖语义相似度检索历史信息,但“语义相似”并不等于“真正相关”,常常出现检索结果不完整、无法区分信息相关性、缺乏推理能力等问题。 为应对上述挑战,微软研究团队提出了全新的AI记忆框架Mnemis,受认识论与认知科学双重启发,让AI不仅能“快速检索”,更能“审慎推理”,在两大权威长期记忆基准上均达到SOTA性能。该工作已被ACL2026主会议接收。 △ RAG的“近视眼”困境 设想这样一个场景:用户问“Dave在2023年去过哪些城市?”,正确答案是San Francisco和Detroit。传统RAG将查询转为向量,在历史对话中寻找语义最相似的片段。结果它找到了Boston和San Francisco,却完全遗漏了Detroit——因为“attended a conference in Detroit”被埋藏在一条长消息中,与“去过哪些城市”的语义相似度不够高。同时,RAG也无法判断Boston是居住城市而非旅行目的地。 这暴露了传统RAG的三个根本局限 孤立评分——每条记忆独立与查询比较,忽略记忆之间的关系; 语义偏见——向量相似度偏爱字面匹配,对间接相关的信息天然不敏感; 无法推理——系统不了解对话历史中存在哪些话题及其相互关系。 打个比方,RAG就像根据书名关键词找书,而有经验的图书馆员会先查阅分类目录,从结构上系统性地定位所有相关书籍。 Mnemis的核心设计:建构式索引+双系统检索 Mnemis的名字源自希腊神话中的记忆女神,其设计分为索引和检索两个阶段。 在索引阶段,传统RAG将对话分块、向量化、存入数据库,不建立任何结构——这对应认识论中的保存主义,记忆只是知识的“搬运工”。而建构主义认为记忆是主动的加工过程,人类在“记住”时就在进行组织和抽象。 Mnemis正是建构主义的计算实现:它将碎片化对话组织成自适应的层级图,而非扁平的向量库。 具体来说,第一层是Base Graph(知识图谱),从对话中提取实体和关系,进行消歧、去重、聚合,消除碎片化。

相关事件

暂无数据

相关公司

暂无数据

相关人物

暂无数据