摘要
Agentic AI需要持久记忆来存储超出LLM有限上下文窗口的用户特定历史记录。现有的记忆系统使用密集向量数据库或知识图谱遍历(或混合),导致检索延迟高且存储扩展性差。我们引入了Hippocampus,一种基于紧凑二进制签名进行语义搜索、利用无损token-ID流进行精确内容重建的代理记忆管理系统。其核心是动态小波矩阵(DWM),该矩阵压缩并联合索引两种流,以支持在压缩域内进行超快速搜索,从而避免昂贵的密集向量或图计算。此设计随内存规模线性扩展,适用于长期代理部署。实证评估表明,Hippocampus将端到端检索延迟降低了高达31倍,并将每查询token占用减少了高达14倍,同时在LoCoMo和LongMemEval基准测试中保持准确性。
AI 推荐理由
论文核心研究了Agent的记忆管理机制,提出了一种高效可扩展的内存模块。
论文信息