web agents task composition semantic layer function abstraction agent skills
摘要

随着网络从人类浏览的媒介转变为软件代理代表用户行动的环境,大型语言模型(LLMs)的进步使得自然语言成为目标导向任务的实用接口。然而,当前大多数网络代理仍依赖低级操作如点击和键盘输入,这些操作脆弱、低效且难以验证。本文提出一种名为Web Verbs的语义层,通过统一接口暴露网站功能,无论其是通过API还是客户端工作流实现。这些动词作为稳定且可组合的单元,使代理能够发现、选择并合成简洁的程序。该方法统一了基于API和浏览器的范式,使LLMs能够生成可靠且可审计的工作流程,并通过预条件、后条件、策略标签和日志支持提高可靠性、效率和可验证性。本文展示了概念验证实现及代表性案例研究,并提出了标准化路线图。

AI 推荐理由

论文聚焦于Agent在Web环境中的任务执行,提出Web Verbs作为技能抽象,用于提升任务规划与执行的可靠性与效率。

论文信息
作者 Linxi Jiang, Rui Xi, Zhijie Liu, Shuo Chen, Zhiqiang Lin et al.
发布日期 2026-02-19
arXiv ID 2602.17245
相关性评分 9/10 (高度相关)