摘要
大型推理模型(LRMs)通过生成长链式推理实现最先进的性能,但常常在正确答案已得出后仍浪费计算资源进行冗余推理。本文提出了一种名为ESTAR的早期停止词感知推理方法,旨在检测并减少此类冗余推理以提高效率而不牺牲准确性。该方法结合了基于轨迹的分类器以识别安全停止推理的时间点、监督微调以训练LRMs自动生成
AI 推荐理由
论文聚焦于提升大模型推理效率,直接涉及推理过程中的冗余检测与优化。
论文信息
大型推理模型(LRMs)通过生成长链式推理实现最先进的性能,但常常在正确答案已得出后仍浪费计算资源进行冗余推理。本文提出了一种名为ESTAR的早期停止词感知推理方法,旨在检测并减少此类冗余推理以提高效率而不牺牲准确性。该方法结合了基于轨迹的分类器以识别安全停止推理的时间点、监督微调以训练LRMs自动生成
论文聚焦于提升大模型推理效率,直接涉及推理过程中的冗余检测与优化。