Agent技能学习 跨领域数据合成 工具接口设计 自动化环境生成
摘要

大型语言模型代理在通过工具解决现实问题方面展现出潜力,但通用智能受到高质量、长时域数据稀缺的限制。现有方法收集受隐私约束的API日志或生成缺乏多样性的脚本交互,难以生成扩展能力所需的数据。本文提出AgentSkiller,一个全自动框架,用于合成跨真实且语义关联领域的多轮交互数据。该框架采用基于DAG的架构,通过显式状态转移确保确定性和可恢复性。流程构建领域本体和以用户为中心的实体图,通过服务蓝图定义工具接口,为模型上下文协议服务器提供支持,并使用一致数据库和严格领域策略填充环境。跨领域融合机制连接服务以模拟复杂任务。最后,流程通过验证解决方案路径、执行验证过滤并使用基于角色的模拟器生成查询,实现自动部署。这生成了具有明确状态变化的可靠环境。实验表明,使用此数据集训练的模型在函数调用方面显著优于基线,尤其在大参数规模下效果更佳。

AI 推荐理由

论文聚焦于通过跨领域数据合成提升Agent的技能学习能力,核心方法围绕工具使用和任务规划展开。

论文信息
作者 Zexu Sun, Bokai Ji, Hengyi Cai, Shuaiqiang Wang, Lei Wang et al.
发布日期 2026-02-10
arXiv ID 2602.09372
相关性评分 9/10 (高度相关)