摘要
对话智能体因上下文窗口限制难以处理长对话,现有记忆系统通常采用离线构建与更新、在线检索的流程。然而,其离线阶段固定且任务无关,导致记忆内容与下游任务需求不匹配。为此,本文提出对抗式记忆适应机制(AMA),通过模拟任务执行实现记忆构建与更新的任务对齐:挑战者智能体基于原始对话生成问答对,利用构建的记忆作答以模拟推理;评估者智能体分析回答错误;适配器智能体据此在策略与内容层面进行双重更新。该机制使记忆系统在离线阶段即获得任务感知监督信号,提升对下游任务的适应性。实验表明,AMA可集成至多种现有记忆系统,并在长对话基准LoCoMo上显著提升性能。
AI 推荐理由
论文聚焦于对话Agent中的记忆系统优化,提出任务导向的对抗式记忆适应机制,核心解决记忆构建与更新对下游任务的适配问题。
论文信息