Chain-of-Thought faithfulness multimodal LLMs visual reasoning
摘要

链式推理(Chain-of-Thought)被广泛用于提升多模态大语言模型(MLLMs)的可解释性,但生成的推理轨迹的可信度仍不清楚。先前的工作主要关注感知幻觉,而对推理层面的不可信性研究较少。为隔离可信度与语言先验,我们引入SPD-Faith Bench,一个基于细粒度图像差异推理的诊断基准,强制进行显式的视觉比较。在最先进的MLLMs上的评估揭示了两种系统性失败模式:感知盲区和感知-推理解离。我们将这些失败归因于视觉注意力衰减和残差流中的表示偏移。基于此分析,我们提出SAGE,一种无需训练的视觉证据校准框架,提升了视觉路由并使推理与感知对齐。我们的结果突出了超越响应正确性之外显式评估可信度的重要性。我们的基准和代码可在https://github.com/Johanson-colab/SPD-Faith-Bench获取。

AI 推荐理由

论文聚焦于Chain-of-Thought推理的faithfulness问题,属于推理能力的核心研究。

论文信息
作者 Weijiang Lv, Yaoxuan Feng, Xiaobo Xia, Jiayu Wang, Yan Jing et al.
发布日期 2026-02-08
arXiv ID 2602.07833
相关性评分 9/10 (高度相关)