摘要
本文提出了一种名为InternAgent-1.5的统一系统,旨在实现计算和实证领域的端到端科学发现。该系统基于由生成、验证和进化三个子系统组成的结构化架构,并具备深度研究、解决方案优化和长期记忆等基础能力。该架构支持系统在长时间的发现周期中持续运行并保持行为的一致性和改进性,同时能够在单一系统内协调计算建模与实验室实验。我们在GAIA、HLE、GPQA和FrontierScience等科学推理基准上对InternAgent-1.5进行了评估,系统表现出色,展示了强大的基础能力。此外,我们还测试了两种类型的发现任务:算法发现任务中,InternAgent-1.5能够自主设计具有竞争力的方法解决核心机器学习问题;在实证发现任务中,它能够执行完整的计算或湿实验,并在地球、生命、生物和物理等领域产生科学发现。总体而言,这些结果表明InternAgent-1.5为自主科学发现提供了一个通用且可扩展的框架。
AI 推荐理由
论文重点描述了InternAgent-1.5在长期科学发现中的自主规划与执行能力,涉及任务分解、多步骤实验设计和跨领域协调。
论文信息