摘要
多智能体协作已被视为增强大语言模型(LLMs)推理能力的一种有前景的范式。然而,现有方法大多依赖启发式策略,缺乏对性能提升驱动因素和系统优化原则的指导。本文提出一个统一的理论框架,将多智能体推理的收益分解为三个独立维度:探索(用于覆盖多样化的解决方案)、信息(用于提供高保真反馈)和聚合(用于达成原则性共识)。基于这一分解,提出了一个新的框架PRISM,通过角色多样性、基于证据的交叉评估反馈以及闭环验证的迭代合成,联合最大化这三个维度。在数学推理、代码生成和函数调用等基准测试中,PRISM表现出优于仅优化部分维度的方法的最先进性能,并具有更高的计算效率。该理论框架为未来多智能体推理系统提供了可操作的设计原则。
AI 推荐理由
论文聚焦于多智能体推理能力的提升,提出理论框架和系统方法,直接关联推理能力主题。
论文信息