摘要
完整的世界模型需要复杂的知识细节。尽管预训练大模型因在大规模互联网数据上的训练而被认为包含类似知识,但直接使用它们进行搜索效率低下且不准确。相反,部分模型专注于对状态和动作子集进行高质量预测,这些状态和动作通过可操作性实现用户意图。本文正式提出,能够实现任务无关、语言条件化意图的智能体必然拥有由可操作性引导的部分世界模型。在多任务设置中,我们引入分布鲁棒的可操作性,并证明可以从部分模型中提取信息显著提高搜索效率。实验结果表明,在桌面机器人任务中,基于可操作性的部分模型相比完整世界模型能减少搜索分支因子并获得更高奖励。
AI 推荐理由
论文聚焦于通过affordances构建部分世界模型以提升任务规划效率,直接关联到Agent的规划能力。
论文信息