测量和缓解反向思维链生成中的事后合理化

推理能力思维链认知锚定结构规划后验合理化

摘要

反向思维链生成（RCG）通过查询-答案对合成推理轨迹，但存在事后合理化风险：当模型在生成过程中能看到答案时，答案会成为认知锚点，影响整个解释。本文通过词法、熵值和概率锚定三个层次的形式化测量体系，分析了语义抑制策略的局限性，并提出结构骨架引导推理（SSR）方法，通过分两阶段生成答案无关的功能结构骨架并指导完整轨迹生成，有效降低锚定效应。进一步引入蒸馏SSR（SSR-D），通过教师生成的SSR轨迹微调模型，确保结构一致性。实验表明，SSR-D在开放推理基准上优于抑制基线10%，同时保持分布外泛化能力。

AI 推荐理由

论文聚焦于推理过程中的后验合理化问题，提出改进方法以增强推理的可靠性与独立性。

论文信息

作者 Guangyue Peng, Zongchao Chen, Wen Luo, Yuntao Wen, Wei Li et al.

发布日期 2026-02-16

arXiv ID 2602.14469