agent configuration reinforcement learning resource allocation task planning
摘要

基于LLM的代理系统配置涉及从大量组合设计空间中选择工作流、工具、令牌预算和提示,目前通常通过固定的大模板或手工调整的启发式方法处理。这导致了脆弱的行为和不必要的计算开销,因为相同的繁琐配置经常应用于简单和复杂输入查询。本文将代理配置表述为按查询的决策问题,并引入ARC(Agentic Resource & Configuration learner),该模型使用强化学习学习一个轻量级分层策略,以动态定制这些配置。在多个涵盖推理和工具增强问答的基准测试中,所学策略始终优于强大的手工设计和其他基线,在提高任务准确性的同时还降低了令牌和运行时成本。这些结果表明,按查询学习代理配置是“一刀切”设计的强大替代方案。

AI 推荐理由

论文聚焦于Agent系统的动态配置,属于任务规划与资源分配的核心研究。

论文信息
作者 Aditya Taparia, Som Sagar, Ransalu Senanayake
发布日期 2026-02-12
arXiv ID 2602.11574
相关性评分 9/10 (高度相关)