双榜SOTA，微软ACL2026新作重新定义AI长记忆文章

36kr 资讯2026-05-27NEWSzh作者: 量子位

摘要

随着大语言模型在各类应用中加速落地，一个核心技术瓶颈日益凸显——AI始终缺乏真正的长期记忆能力。当前主流的RAG（检索增强生成）方案依赖语义相似度检索历史信息，但“语义相似”并不等于“真正相关”，常常出现检索结果不完整、无法区分信息相关性、缺乏推理能力等问题。为应对上述挑战，微软研究团队提出了全新的AI记忆框架Mnemis，受认识论与认知科学双重启发，让AI不仅能“快速检索”，更能“审慎推理”，在两大权威长期记忆基准上均达到SOTA性能。该工作已被ACL2026主会议接收。 △ RAG的“近视眼”困境设想这样一个场景：用户问“Dave在2023年去过哪些城市？”，正确答案是San Francisco和Detroit。传统RAG将查询转为向量，在历史对话中寻找语义最相似的片段。结果它找到了Boston和San Francisco，却完全遗漏了Detroit——因为“attended a conference in Detroit”被埋藏在一条长消息中，与“去过哪些城市”的语义相似度不够高。同时，RAG也无法判断Boston是居住城市而非旅行目的地。这暴露了传统RAG的三个根本局限孤立评分——每条记忆独立与查询比较，忽略记忆之间的关系；语义偏见——向量相似度偏爱字面匹配，对间接相关的信息天然不敏感；无法推理——系统不了解对话历史中存在哪些话题及其相互关系。打个比方，RAG就像根据书名关键词找书，而有经验的图书馆员会先查阅分类目录，从结构上系统性地定位所有相关书籍。 Mnemis的核心设计：建构式索引+双系统检索 Mnemis的名字源自希腊神话中的记忆女神，其设计分为索引和检索两个阶段。在索引阶段，传统RAG将对话分块、向量化、存入数据库，不建立任何结构——这对应认识论中的保存主义，记忆只是知识的“搬运工”。而建构主义认为记忆是主动的加工过程，人类在“记住”时就在进行组织和抽象。 Mnemis正是建构主义的计算实现：它将碎片化对话组织成自适应的层级图，而非扁平的向量库。具体来说，第一层是Base Graph（知识图谱），从对话中提取实体和关系，进行消歧、去重、聚合，消除碎片化。

双榜SOTA，微软ACL2026新作重新定义AI长记忆文章

摘要

相关事件

相关公司

相关人物

相关产品查看全部 (1)

相关技术查看全部 (8)

双榜SOTA，微软ACL2026新作重新定义AI长记忆 文章

摘要

相关事件

相关公司

相关人物

相关产品查看全部 (1)

相关技术查看全部 (8)

双榜SOTA，微软ACL2026新作重新定义AI长记忆文章