摘要
反向思维链生成(RCG)通过查询-答案对合成推理轨迹,但存在事后合理化风险:当模型在生成过程中能看到答案时,答案会成为认知锚点,影响整个解释。本文通过词法、熵值和概率锚定三个层次的形式化测量体系,分析了语义抑制策略的局限性,并提出结构骨架引导推理(SSR)方法,通过分两阶段生成答案无关的功能结构骨架并指导完整轨迹生成,有效降低锚定效应。进一步引入蒸馏SSR(SSR-D),通过教师生成的SSR轨迹微调模型,确保结构一致性。实验表明,SSR-D在开放推理基准上优于抑制基线10%,同时保持分布外泛化能力。
AI 推荐理由
论文聚焦于推理过程中的后验合理化问题,提出改进方法以增强推理的可靠性与独立性。
论文信息