multi-agent reasoning gain decomposition PRISM framework consensus aggregation exploration and feedback
摘要

多智能体协作已被视为增强大语言模型(LLMs)推理能力的一种有前景的范式。然而,现有方法大多依赖启发式策略,缺乏对性能提升驱动因素和系统优化原则的指导。本文提出一个统一的理论框架,将多智能体推理的收益分解为三个独立维度:探索(用于覆盖多样化的解决方案)、信息(用于提供高保真反馈)和聚合(用于达成原则性共识)。基于这一分解,提出了一个新的框架PRISM,通过角色多样性、基于证据的交叉评估反馈以及闭环验证的迭代合成,联合最大化这三个维度。在数学推理、代码生成和函数调用等基准测试中,PRISM表现出优于仅优化部分维度的方法的最先进性能,并具有更高的计算效率。该理论框架为未来多智能体推理系统提供了可操作的设计原则。

AI 推荐理由

论文聚焦于多智能体推理能力的提升,提出理论框架和系统方法,直接关联推理能力主题。

论文信息
作者 Yiming Yang, Zhuoyuan Li, Fanxiang Zeng, Hao Fu, Yue Liu
发布日期 2026-02-09
arXiv ID 2602.08586
相关性评分 9/10 (高度相关)