摘要
大语言模型智能体常难以从经验中积累知识,将每个任务视为独立挑战。现有方法将经验提取为扁平文本知识,无法捕捉复杂子任务的程序逻辑,且缺乏维护机制,导致经验库随积累而退化。本文提出AutoRefine框架,从智能体执行历史中提取并维护双形态经验模式:对程序性子任务,提取具备独立推理与记忆能力的专用子智能体;对静态知识,则提取为指南或代码片段形式的技能模式。框架还包含持续维护机制,通过评分、剪枝与合并防止经验库退化。在ALFWorld、ScienceWorld和TravelPlanner上的实验表明,AutoRefine分别达到98.4%、70.4%和27.1%的成功率,并减少20–73%的执行步骤;在TravelPlanner上,其自动提取性能超越人工设计系统(27.1% vs 12.1%),验证了其捕获程序协调能力的有效性。
AI 推荐理由
提出双形态经验模式及持续维护机制,核心解决Agent记忆积累与退化问题。
论文信息