摘要
多模态大语言模型(MLLM)智能体在图形用户界面(GUI)自动化中面临长周期、跨应用任务的挑战,主要受限于上下文窗口。现有记忆系统难以适应动态GUI环境,存在高层意图与底层执行间的粒度不匹配及上下文污染问题。为此,本文提出达尔文式记忆系统(DMS),将记忆构建为遵循“适者生存”法则的动态生态系统。DMS将复杂轨迹分解为独立可复用单元,并通过效用驱动的自然选择机制追踪记忆单元的生存价值,主动剪枝次优路径并抑制高风险计划。在真实多应用基准上的实验表明,DMS无需训练成本或架构改动即可显著提升通用MLLM性能,平均成功率提高18.0%,执行稳定性提升33.9%,同时降低任务延迟。
AI 推荐理由
论文提出新型自进化记忆系统DMS,核心聚焦Agent Memory机制。
论文信息