临床代理 推理增强 图编辑距离 检索增强生成 医疗问答
摘要

临床决策支持不仅需要正确答案,还需要具有临床有效性的推理过程。本文提出了一种差分推理学习(DRL)框架,通过从参考推理依据(如医生撰写的临床依据、临床指南或更强大模型的输出)和代理的自由形式思维链(CoT)中提取推理图,并基于临床加权图编辑距离(GED)进行差异分析,从而提高临床代理的推理能力。一个作为法官的LLM对语义等价节点进行对齐并诊断图之间的差异。这些图级别的差异诊断被转换为自然语言指令,并存储在差分推理知识库(DR-KB)中。在推理阶段,通过检索增强生成(RAG)方法检索前k条指令以增强代理提示,修补可能的逻辑漏洞。在开放医学问答基准和内部临床数据的再入院预测任务上的评估表明,该方法优于基线,在最终答案准确性和推理一致性方面均有提升。消融实验进一步验证了引入参考推理依据和前k检索策略的有效性。临床医生对输出的审查也提供了额外的保障。结果表明,DRL能够支持复杂推理场景下的更可靠的临床决策,并提供一种在有限token预算下部署的实用机制。

AI 推荐理由

论文核心围绕临床代理的推理能力改进,提出差分推理学习框架以提升推理准确性与合理性。

论文信息
作者 Jinsong Liu, Yuhang Jiang, Ramayya Krishnan, Rema Padman, Yiye Zhang et al.
发布日期 2026-02-10
arXiv ID 2602.09945
相关性评分 10/10 (高度相关)