摘要
通用目的机器人操作受到多样化现实交互数据稀缺的限制。与视觉或语言领域的网络数据收集不同,机器人数据收集是一个主动过程,成本高昂。为此,本文提出RoboGene,一个智能体框架,用于自动生成适用于单臂、双臂和移动机器人的多样化且物理可行的操作任务。该框架包含三个核心组件:多样性驱动的采样以确保广泛的任务覆盖、自我反思机制以强制执行物理约束,以及人机协同的持续改进机制。通过大规模现实实验和18,000条轨迹的数据集,验证了RoboGene在任务质量、可行性和多样性方面的优越性,并显著优于现有基础模型(如GPT-4o、Gemini 2.5 Pro)。结果表明,使用RoboGene预训练的VLA模型在成功率和泛化能力方面表现更优。
AI 推荐理由
论文核心聚焦于通过智能体框架自动生成多样化的现实任务,涉及任务规划与生成机制。
论文信息