摘要
本文探讨了不同类型和用途的记忆如何帮助智能体在不断变化的不确定环境中进行空间导航。在所研究的简单觅食任务中,智能体每天需要从其家园穿过障碍物找到食物。然而,世界是非静态的,障碍物和食物的位置可能每天变化,且智能体的感知信息(如位置)具有不确定性且非常有限。任何模型构建(如地图)和使用(如规划)都必须应对这些挑战,并且如果学习要有效,则必须足够快速。我们考察了一系列从简单到复杂的策略,涉及不同的记忆和学习方式。我们发现,一种能够整合多种策略的架构是处理不同性质子任务的关键,特别是在探索和搜索未知食物位置时,以及在规划通往已记住的(可能的)食物位置的路径时。利用非静态概率学习技术不断更新其(情景)记忆,并利用这些记忆构建地图并实时规划路径(即不完美的地图,即嘈杂且仅限于智能体经验的地图)的智能体,在任务难度(如目标距离)增加时,相较于简单的(低记忆)智能体,效率显著提高,只要定位和变化带来的不确定性不是太大。
AI 推荐理由
论文重点研究了记忆机制在非静态环境中的应用,包括记忆更新、地图构建和路径规划。
论文信息