摘要
分子生成与优化是化学领域的一项基础任务。随着智能工具(尤其是具有强大知识储备和交互能力的大语言模型)的快速发展,为该任务提供了新的范式。然而,LLMs在分子结构与药理性质之间的复杂隐含关系以及缺乏相应标注数据方面仍面临内在挑战。为此,我们提出DrugR,一种基于LLM的方法,将显式的、逐步的药理推理引入优化过程。该方法整合了领域特定的持续预训练、通过反向数据工程进行的监督微调以及自平衡的多粒度强化学习。这一框架使DrugR能够有效提升关键ADMET性质,同时保留原始分子的核心疗效。实验结果表明,DrugR在多个性质上实现了全面增强,而不会牺牲结构相似性或靶标结合亲和力。重要的是,其显式推理过程为每一步优化提供了清晰、可解释的理由,从而产生可操作的设计见解,并推动自动化、知识驱动的科学发现。我们的代码和模型检查点已开源以促进未来研究。
AI 推荐理由
论文核心在于引入显式药理推理优化分子药物,直接关联推理能力主题。
论文信息