摘要
近期研究通过在潜在空间中使用连续表示来替代显式推理轨迹以提高推理效率,但其效果因场景而异。分析表明,得出错误答案的推理轨迹中低置信度步骤较少,而多个低置信度推理路径的软嵌入可能引入并传播噪声,导致对不可靠推理轨迹的高置信度。受此启发,本文提出了一种推理时的置信度感知路由机制ThinkRouter,用于避免高置信度和噪声,从而实现更高效的推理。当模型置信度较低时,ThinkRouter将思考路由到离散标记空间,否则路由到潜在空间。在STEM推理和编程基准测试中,ThinkRouter在准确性方面优于显式思维链、随机路由和潜在推理基线,在Pass@1指标上平均提升了19.70分,同时减少了高达15.55%的生成长度。进一步分析表明,ThinkRouter能够校准来自显式思维链和潜在推理的误差,并通过全局降低模型置信度加速推理结束时的标记生成。
AI 推荐理由
论文聚焦于推理效率提升,提出基于置信度的路由机制,直接针对LLM的推理能力优化。
论文信息