摘要
大语言模型(LLM)智能体因上下文窗口有限,在长时程推理中面临根本性限制,高效记忆管理至关重要。现有方法通常将长期记忆(LTM)与短期记忆(STM)作为独立组件处理,依赖启发式规则或辅助控制器,限制了适应性与端到端优化。本文提出Agentic Memory(AgeMem),一种将LTM与STM管理直接融入智能体策略的统一框架。AgeMem将记忆操作建模为基于工具的动作,使LLM智能体能自主决定何时及如何存储、检索、更新、摘要或丢弃信息。为训练此类统一行为,作者设计了三阶段渐进式强化学习策略,并提出逐步GRPO算法以应对记忆操作带来的稀疏与不连续奖励。在五个长时程基准上的实验表明,AgeMem在多种LLM主干上均显著优于强基线,提升了任务性能、长期记忆质量及上下文使用效率。
AI 推荐理由
论文标题与内容均聚焦于LLM Agent的统一长短期记忆管理机制。
论文信息