机器人操作 任务生成 智能体框架 VLA预训练 物理约束
摘要

通用目的机器人操作受到多样化现实交互数据稀缺的限制。与视觉或语言领域的网络数据收集不同,机器人数据收集是一个主动过程,成本高昂。为此,本文提出RoboGene,一个智能体框架,用于自动生成适用于单臂、双臂和移动机器人的多样化且物理可行的操作任务。该框架包含三个核心组件:多样性驱动的采样以确保广泛的任务覆盖、自我反思机制以强制执行物理约束,以及人机协同的持续改进机制。通过大规模现实实验和18,000条轨迹的数据集,验证了RoboGene在任务质量、可行性和多样性方面的优越性,并显著优于现有基础模型(如GPT-4o、Gemini 2.5 Pro)。结果表明,使用RoboGene预训练的VLA模型在成功率和泛化能力方面表现更优。

AI 推荐理由

论文核心聚焦于通过智能体框架自动生成多样化的现实任务,涉及任务规划与生成机制。

论文信息
作者 Yixue Zhang, Kun Wu, Zhi Gao, Zhen Zhao, Pei Ren et al.
发布日期 2026-02-18
arXiv ID 2602.16444
相关性评分 9/10 (高度相关)