LLM Agent Model Routing
摘要

由多个大语言模型(LLMs)、工具和记忆模块协同构成的复杂智能体系统在多轮复杂任务中展现出卓越能力,但其高昂成本与严重延迟揭示了性能、成本与速度之间的关键权衡难题,即“智能体系统三难困境”。为此,本文提出EvoRoute——一种自演化的模型路由范式,通过不断积累的先验经验知识库,在每一步动态选择帕累托最优的LLM主干模型,平衡准确性、效率与资源消耗,并利用环境反馈持续优化自身路由策略。在GAIA和BrowseComp+等挑战性基准上的实验表明,EvoRoute集成至现成智能体系统后,不仅维持或提升性能,还可降低执行成本高达80%,减少延迟超70%。

AI 推荐理由

论文提及memory模块作为系统组件,但聚焦于模型路由优化而非记忆机制本身。

论文信息
作者 Guibin Zhang, Haiyang Yu, Kaiming Yang, Bingli Wu, Fei Huang et al.
发布日期 2026-01-06
arXiv ID 2601.02695
相关性评分 6/10 (相关)