摘要
近年来,基于大语言模型的多智能体系统(MAS)快速发展,通常利用路由器分解任务并分配给专用智能体。直接扩展智能体池易因路由器对新增异构、不可靠智能体的冷启动而导致性能崩溃。本文提出MonoScale,一种面向扩展的更新框架,主动生成少量智能体条件化熟悉任务,从成功与失败交互中收集证据,并将其提炼为可审计的自然语言记忆以指导后续路由。我们将顺序增强形式化为上下文赌博机问题,并采用信任区域记忆更新策略,确保在各轮次接入过程中性能单调非递减。在GAIA和Humanity's Last Exam上的实验表明,随着智能体池扩大,系统性能稳定提升,优于朴素扩展及固定池强路由器基线。
AI 推荐理由
提出可审计的自然语言记忆机制用于路由决策,是系统核心组件。
论文信息