预算约束 任务规划 工具调用 意图感知 强化学习
摘要

本文研究了在严格预算限制下,如何通过调用外部工具使大型语言模型完成多步骤任务。由于状态-动作空间巨大、结果方差高以及探索成本高昂,直接规划变得不可行。为此,我们提出了INTENT,一个推理时的规划框架,利用意图感知的分层世界模型来预测未来的工具使用、风险校准的成本,并在线指导决策。在增强成本的StableToolBench基准测试中,INTENT严格保证预算可行性,显著提升了任务成功率,并在动态市场变化(如工具价格波动和预算变化)下保持鲁棒性。

AI 推荐理由

论文聚焦于预算约束下的任务规划,提出基于意图的规划框架INTENT,直接针对Agent的规划能力进行优化。

论文信息
作者 Hanbing Liu, Chunhao Tian, Nan An, Ziyuan Wang, Pinyan Lu et al.
发布日期 2026-02-12
arXiv ID 2602.11541
相关性评分 9/10 (高度相关)