推理能力 思维链 认知锚定 结构规划 后验合理化
摘要

反向思维链生成(RCG)通过查询-答案对合成推理轨迹,但存在事后合理化风险:当模型在生成过程中能看到答案时,答案会成为认知锚点,影响整个解释。本文通过词法、熵值和概率锚定三个层次的形式化测量体系,分析了语义抑制策略的局限性,并提出结构骨架引导推理(SSR)方法,通过分两阶段生成答案无关的功能结构骨架并指导完整轨迹生成,有效降低锚定效应。进一步引入蒸馏SSR(SSR-D),通过教师生成的SSR轨迹微调模型,确保结构一致性。实验表明,SSR-D在开放推理基准上优于抑制基线10%,同时保持分布外泛化能力。

AI 推荐理由

论文聚焦于推理过程中的后验合理化问题,提出改进方法以增强推理的可靠性与独立性。

论文信息
作者 Guangyue Peng, Zongchao Chen, Wen Luo, Yuntao Wen, Wei Li et al.
发布日期 2026-02-16
arXiv ID 2602.14469
相关性评分 9/10 (高度相关)