web navigation plan exploration MCTS semantic planning autonomous agents
摘要

大型语言模型(LLMs)已使自主代理能够处理复杂的网页导航任务。尽管近期研究通过树搜索增强长期推理能力,但在网页导航中应用这些算法面临两个关键挑战:有效路径稀疏导致探索效率低下,以及噪声上下文削弱了准确的状态感知。为了解决这些问题,我们引入了Plan-MCTS框架,通过将探索转移到语义计划空间来重构网页导航。该框架通过将战略规划与执行基础解耦,将稀疏的动作空间转换为密集的计划树以实现高效探索,并将噪声上下文提炼为抽象语义历史以提高状态感知精度。为了确保效率和鲁棒性,Plan-MCTS引入了双门控奖励机制,严格验证物理可执行性和战略一致性,并采用结构优化方法对失败子计划进行策略内修复。在WebArena上的大量实验表明,Plan-MCTS实现了最先进的性能,在任务有效性和搜索效率方面均优于现有方法。

AI 推荐理由

论文核心围绕任务规划展开,提出Plan-MCTS框架用于提升网络导航中的计划探索与执行效率。

论文信息
作者 Weiming Zhang, Jihong Wang, Jiamu Zhou, Qingyao Li, Xinbei Ma et al.
发布日期 2026-02-15
arXiv ID 2602.14083
相关性评分 10/10 (高度相关)