摘要
当前人工智能向智能体科学的发展受限于超长周期自主性——即在持续数天或数周的实验周期中维持战略连贯性与迭代修正的能力。尽管大语言模型(LLMs)在短周期推理中表现优异,但在高维、延迟反馈的真实科研环境中易被执行细节淹没,难以将稀疏反馈整合为长期指导。本文提出ML-Master 2.0,一种掌握超长周期机器学习工程(MLE)的自主智能体。通过将上下文管理重构为认知积累过程,引入受计算机系统启发的分层认知缓存(HCC)架构,实现经验在时间维度上的结构化区分。HCC动态将瞬时执行轨迹提炼为稳定知识与跨任务智慧,使智能体解耦即时执行与长期实验策略,有效突破静态上下文窗口的扩展限制。在OpenAI MLE-Bench上24小时预算内,ML-Master 2.0达到56.44%的最先进奖牌率。
AI 推荐理由
提出分层认知缓存机制,核心解决长期记忆与知识积累问题。
论文信息