Agent Memory Web Agents
摘要

尽管多模态大语言模型取得进展,自主网页智能体在复杂动态网页界面上执行长周期任务仍面临挑战。现有方法常受限于元素定位不准、缺乏站点特定流程知识,以及在复杂DOM结构中长期任务跟踪与记忆不稳定。为此,本文提出Avenir-Web,在真实部署环境下于Online-Mind2Web基准上达到开源新SOTA。该系统结合混合定位专家、经验模仿规划以引入流程先验,并采用任务追踪清单与自适应记忆机制,实现跨多样化用户界面的鲁棒交互。实验表明,Avenir-Web显著优于先前开源智能体,性能媲美顶尖闭源模型。

AI 推荐理由

提出自适应记忆机制用于长期任务跟踪,是关键但非唯一核心。

论文信息
作者 Aiden Yiliu Li, Xinyue Hao, Shilong Liu, Mengdi Wang
发布日期 2026-02-02
arXiv ID 2602.02468
相关性评分 7/10 (相关)