世界模型 具身智能体
摘要

基于语言模型的具身智能体在现实场景中日益普及,但在动态环境中适应能力有限,而构建准确且灵活的世界模型对有效推理与决策至关重要。为此,本文将混合专家(MoE)范式扩展至具身智能体,提出测试时世界模型混合框架(TMoW)。该框架在测试阶段动态更新世界模型的路由函数,通过多粒度原型路由、测试时特征对齐及基于蒸馏的混合增强,实现对未知和演化环境的持续适应。实验在VirtualHome、ALFWorld和RLBench基准上验证了其在零样本适应与少样本扩展场景中的优越性能。

AI 推荐理由

涉及世界模型的动态组合与更新,隐含记忆机制但未显式研究记忆架构。

论文信息
作者 Jinwoo Jang, Minjong Yoo, Sihyung Yoon, Honguk Woo
发布日期 2026-01-30
arXiv ID 2601.22647
相关性评分 6/10 (相关)