在线学习 记忆演化
摘要

大语言模型(LLM)智能体日益配备记忆机制,以存储经验并提供可复用的指导,从而提升任务求解性能。现有自演化系统多基于静态训练/测试划分,难以应对真实分布偏移和持续反馈场景。本文提出Live-Evo——一种在线自演化记忆系统,通过“经验库”与“元指导库”解耦“发生了什么”与“如何使用”,为每个任务动态生成适应性指导。系统根据反馈在线调整经验权重:有效经验被强化并频繁检索,误导或过时经验则被降权并逐渐遗忘,模拟人类记忆的强化与衰减机制。在为期10周的Prophet Arena在线基准上,Live-Evo将Brier评分提升20.8%,市场回报提高12.9%,并在深度研究任务中持续优于强基线。

AI 推荐理由

论文核心聚焦于Agent Memory的在线演化机制,提出明确的双库架构与记忆更新策略。

论文信息
作者 Yaolun Zhang, Yiran Wu, Yijiong Yu, Qingyun Wu, Huazheng Wang
发布日期 2026-02-02
arXiv ID 2602.02369
相关性评分 10/10 (高度相关)