Agent Memory Interactive Retrieval
摘要

人类在对话中回忆信息时常需多轮交互才能完成“话到嘴边”的检索过程,而现有智能体评估基准多局限于单轮设定。为更真实地模拟此类记忆检索场景,本文提出基于模糊与欠指定检索的双智能体评估基准DETOUR(Dual-agent based Evaluation Through Obscure Under-specified Retrieval),包含1,011个提示。该基准设有一个被评估的主智能体(Primary Agent)和一个在所有评估中保持一致的记忆智能体(Memory Agent),主智能体需通过查询后者来识别目标实体。实验表明,当前最先进的模型在涵盖文本、图像、音频和视频的多模态任务上仅达到36%的准确率,凸显了提升智能体在欠指定情境下记忆与推理能力的重要性。

AI 推荐理由

提出双智能体记忆交互框架,Memory Agent作为稳定记忆源,是任务关键组件。

论文信息
作者 Li Siyan, Darshan Deshpande, Anand Kannappan, Rebecca Qian
发布日期 2026-01-30
arXiv ID 2602.00352
相关性评分 7/10 (相关)