验证机制 推理可靠性 弱验证 强验证 错误控制
摘要

随着大语言模型(LLM)在更广泛的验证循环中进行推理,系统内部使用诸如自一致性或代理奖励等低成本检查(称为弱验证),而外部用户则通过反馈对输出进行审查以确保结果可信(称为强验证)。这两种验证方式在成本和可靠性上存在显著差异。本文通过形式化弱-强验证策略,决定何时接受或拒绝基于弱验证的结果,以及何时转为强验证。我们引入了衡量错误接受、错误拒绝和强验证频率的指标,并证明最优策略具有双阈值结构。此外,我们开发了一种在线算法,在无需假设查询流、语言模型或弱验证器的前提下,可有效控制接受和拒绝错误。

AI 推荐理由

论文聚焦于LLM的推理过程中的验证机制,涉及弱验证与强验证策略,直接关联推理能力的可靠性与优化。

论文信息
作者 Shayan Kiyani, Sima Noorani, George Pappas, Hamed Hassani
发布日期 2026-02-19
arXiv ID 2602.17633
相关性评分 9/10 (高度相关)