摘要
智能体记忆系统常采用标准的检索增强生成(RAG)流程,但其底层假设在此场景下并不适用。RAG面向大型异构语料库,而智能体记忆是有限、连贯且高度相关的对话流,常含重复片段。固定top-k相似性检索易返回冗余上下文,事后剪枝可能删除推理所需的时序前提。本文主张检索应超越相似匹配,转而操作潜在语义成分,遵循“解耦—聚合”范式:将记忆解耦为语义单元,组织成层次结构,并以此驱动检索。所提xMemory通过稀疏性—语义目标引导记忆的拆分与合并,构建忠实且可检索的高层节点结构。推理时采用自上而下策略,为多事实查询选择紧凑多样的主题与语义,仅在降低阅读器不确定性时才展开至具体事件或原始消息。在LoCoMo和PerLTQA上的实验表明,该方法在三大最新LLM上均显著提升回答质量与token效率。
AI 推荐理由
论文聚焦Agent Memory机制,提出超越RAG的新架构。
论文信息