摘要
法律推理不仅需要正确的结果,还需要符合程序规范的推理过程。然而现有方法缺乏对中间推理步骤的验证机制,导致错误(如不适用的法规引用)在推理链中未被检测到。为此,本文提出LawThinker,一种采用探索-验证-记忆策略的自主法律研究代理,适用于动态司法环境。其核心思想是在每次知识探索后强制执行验证操作。DeepVerifier模块从知识准确性、事实与法律的相关性以及程序合规性三个维度检查每个检索结果,并通过记忆模块实现长周期任务中的跨轮次知识复用。在动态基准J1-EVAL上的实验表明,LawThinker相比直接推理方法提升了24%,比基于工作流的方法提升了11%,尤其在面向过程的指标上表现突出。在三个静态基准上的评估进一步验证了其泛化能力。
AI 推荐理由
论文聚焦于法律推理过程的验证与改进,核心机制围绕推理步骤的准确性与合规性展开。
论文信息