摘要
本文研究了在严格预算限制下,如何通过调用外部工具使大型语言模型完成多步骤任务。由于状态-动作空间巨大、结果方差高以及探索成本高昂,直接规划变得不可行。为此,我们提出了INTENT,一个推理时的规划框架,利用意图感知的分层世界模型来预测未来的工具使用、风险校准的成本,并在线指导决策。在增强成本的StableToolBench基准测试中,INTENT严格保证预算可行性,显著提升了任务成功率,并在动态市场变化(如工具价格波动和预算变化)下保持鲁棒性。
AI 推荐理由
论文聚焦于预算约束下的任务规划,提出基于意图的规划框架INTENT,直接针对Agent的规划能力进行优化。
论文信息