机器人导航 社交规范 视觉语言模型 路径规划
摘要

在人类环境中进行社交导航不仅需要满足几何约束,还需避免干扰正在进行的活动并符合社会规范。本文提出了一种结合几何规划与上下文社会推理的社交机器人导航框架。系统首先提取障碍物和人类动态以生成几何可行的候选路径,然后利用微调的视觉语言模型(VLM)评估这些路径,并根据情境化的社会期望选择最优路径。该任务特定的VLM将大型基础模型中的社会推理能力提炼为更小、更高效的模型,使框架能够在多样化的人机交互场景中实现实时适应。实验结果表明,该方法在四个社交导航场景中表现最佳,具有最低的个人空间侵犯时间、最少的面向行人时间以及无社交区域入侵。

AI 推荐理由

论文核心研究了基于社会规范的路径规划,结合几何规划与社会推理,属于规划能力的核心内容。

论文信息
作者 Zilin Fang, Anxing Xiao, David Hsu, Gim Hee Lee
发布日期 2026-02-09
arXiv ID 2602.09002
相关性评分 9/10 (高度相关)