经验记忆 持续学习
摘要

大语言模型智能体常难以从经验中积累知识,将每个任务视为独立挑战。现有方法将经验提取为扁平文本知识,无法捕捉复杂子任务的程序逻辑,且缺乏维护机制,导致经验库随积累而退化。本文提出AutoRefine框架,从智能体执行历史中提取并维护双形态经验模式:对程序性子任务,提取具备独立推理与记忆能力的专用子智能体;对静态知识,则提取为指南或代码片段形式的技能模式。框架还包含持续维护机制,通过评分、剪枝与合并防止经验库退化。在ALFWorld、ScienceWorld和TravelPlanner上的实验表明,AutoRefine分别达到98.4%、70.4%和27.1%的成功率,并减少20–73%的执行步骤;在TravelPlanner上,其自动提取性能超越人工设计系统(27.1% vs 12.1%),验证了其捕获程序协调能力的有效性。

AI 推荐理由

提出双形态经验模式及持续维护机制,核心解决Agent记忆积累与退化问题。

论文信息
作者 Libin Qiu, Zhirong Gao, Junfu Chen, Yuhang Ye, Weizhi Huang et al.
发布日期 2026-01-30
arXiv ID 2601.22758
相关性评分 9/10 (高度相关)