PRISM：通过收益分解实现多智能体推理的原则性框架

multi-agent reasoning gain decomposition PRISM framework consensus aggregation exploration and feedback

摘要

多智能体协作已被视为增强大语言模型（LLMs）推理能力的一种有前景的范式。然而，现有方法大多依赖启发式策略，缺乏对性能提升驱动因素和系统优化原则的指导。本文提出一个统一的理论框架，将多智能体推理的收益分解为三个独立维度：探索（用于覆盖多样化的解决方案）、信息（用于提供高保真反馈）和聚合（用于达成原则性共识）。基于这一分解，提出了一个新的框架PRISM，通过角色多样性、基于证据的交叉评估反馈以及闭环验证的迭代合成，联合最大化这三个维度。在数学推理、代码生成和函数调用等基准测试中，PRISM表现出优于仅优化部分维度的方法的最先进性能，并具有更高的计算效率。该理论框架为未来多智能体推理系统提供了可操作的设计原则。

AI 推荐理由

论文聚焦于多智能体推理能力的提升，提出理论框架和系统方法，直接关联推理能力主题。

论文信息

作者 Yiming Yang, Zhuoyuan Li, Fanxiang Zeng, Hao Fu, Yue Liu

发布日期 2026-02-09

arXiv ID 2602.08586