摘要
多智能体辩论可提升推理质量并减少幻觉,但随着辩论轮次和智能体数量增加,上下文迅速膨胀。保留完整文本历史会导致令牌使用超出上下文限制,并常需重复摘要,带来额外开销与信息损失。本文提出DebateOCR——一种跨模态压缩框架,将冗长的文本辩论记录替换为紧凑的图像表示,并通过专用视觉编码器在后续轮次中加以利用。该方法可将通常达数万至数十万令牌的历史压缩92%以上,在多个基准上显著降低计算成本并加速推理。理论分析表明,智能体间的多样性有助于恢复被省略的信息:尽管单个压缩历史可能丢失细节,但聚合多个智能体的压缩视图可使集体表征以指数级高概率逼近信息瓶颈。
AI 推荐理由
提出跨模态记忆压缩机制,显著优化多智能体辩论中的记忆存储与使用效率。
论文信息