摘要
当前主流医疗AI采用不切实际的“一次性”诊断模式,而真实临床诊断是一个迭代过程,医生需依次提问和安排检查以高效获取信息。为此,作者提出新基准Med-Inquire,基于真实病例模拟多轮诊断,通过Patient与Examination智能体隐藏完整病历,迫使诊断智能体主动获取信息。为应对该挑战,作者设计了EvoClinician——一种在测试时自演化的智能体,其核心为“诊断-评分-演化”循环:Actor执行诊断;Process Grader评估每步操作的临床价值与资源效率;Evolver据此反馈演化Actor的提示与记忆。实验表明,EvoClinician优于持续学习基线及其他自演化智能体。
AI 推荐理由
论文核心机制包含通过演化更新Agent的记忆,Memory是策略优化的关键组成部分。
论文信息