摘要
基于下一词预测训练的大语言模型(LLMs)在临床基础模型中取得成功,其表征在多种生物医学任务中表现优异。然而,该范式将患者视为待总结的文档,而非需模拟的动态系统。为此,作者提出SMB-Structure——一种结合联合嵌入预测架构(JEPA)与监督微调(SFT)的世界模型。SFT使模型能在token空间重建未来患者状态,而JEPA仅从初始表征在潜在空间预测未来状态,迫使模型在观测下一状态前编码轨迹动态。在两个大规模队列(MSK和INSPECT)上的实验表明,该方法学习到的嵌入能捕捉自回归基线无法恢复的疾病动态,在高异质性患者任务中表现优异。
AI 推荐理由
涉及状态表征与轨迹建模,隐含记忆机制但未显式研究Agent Memory。
论文信息