进化算法 多智能体系统 科学发现自动化 结构化研究 反思机制
摘要

在复杂且依赖实验的科学发现领域中,自动化不仅需要程序的迭代变异,还需要结构化的假设管理、环境交互和原则性反思。本文提出了OR-Agent,一种可配置的多智能体研究框架,旨在用于丰富实验环境中的自动化探索。OR-Agent将研究组织为基于树的结构化工作流,显式建模分支假设生成和系统回溯,从而实现对研究轨迹的控制管理,超越简单的变异-交叉循环。其核心引入了一种进化-系统性思想机制,统一了研究起点的进化选择、全面的研究计划生成以及研究树内的协调探索。此外,还提出了一种受分层优化启发的反思系统:短期实验反思作为一种语言梯度提供即时校正信号;长期反思积累跨实验的见解作为语言动量;记忆压缩则作为类似权重衰减的正则化机制,保留关键信号并减少漂移。这些组件共同构成了一个指导研究动态的原则性架构。我们在经典组合优化基准(如旅行商问题、带容量约束的车辆路径问题、装箱问题、定向越野问题和多重背包问题)以及基于模拟的合作驾驶场景中进行了大量实验。结果表明,OR-Agent优于强大的进化基线,并提供了一个通用、可扩展且可检查的AI辅助科学发现框架。

AI 推荐理由

论文核心围绕进化搜索与结构化研究的结合,提出了一种基于进化的系统性思想机制和反思系统。

论文信息
作者 Qi Liu, Wanjing Ma
发布日期 2026-02-14
arXiv ID 2602.13769
相关性评分 9/10 (高度相关)