AutoRefine：从轨迹到可复用专长的持续大语言模型智能体优化框架

摘要

大语言模型智能体常难以从经验中积累知识，将每个任务视为独立挑战。现有方法将经验提取为扁平文本知识，无法捕捉复杂子任务的程序逻辑，且缺乏维护机制，导致经验库随积累而退化。本文提出AutoRefine框架，从智能体执行历史中提取并维护双形态经验模式：对程序性子任务，提取具备独立推理与记忆能力的专用子智能体；对静态知识，则提取为指南或代码片段形式的技能模式。框架还包含持续维护机制，通过评分、剪枝与合并防止经验库退化。在ALFWorld、ScienceWorld和TravelPlanner上的实验表明，AutoRefine分别达到98.4%、70.4%和27.1%的成功率，并减少20–73%的执行步骤；在TravelPlanner上，其自动提取性能超越人工设计系统（27.1% vs 12.1%），验证了其捕获程序协调能力的有效性。

AI 推荐理由

提出双形态经验模式及持续维护机制，核心解决Agent记忆积累与退化问题。

论文信息

作者 Libin Qiu, Zhirong Gao, Junfu Chen, Yuhang Ye, Weizhi Huang et al.

发布日期 2026-01-30

arXiv ID 2601.22758