Agent Memory 多智能体系统
摘要

在线内容的真实性评估日益重要。尽管大语言模型(LLMs)在自动事实核查和主张验证方面取得进展,现有方法通常将证据检索视为静态、孤立的步骤,难以跨主张有效管理或复用证据。本文提出MERMAID——一种记忆增强的多智能体真实性评估框架,通过将检索与推理过程紧密耦合,在Reason-Action式迭代流程中整合智能体驱动的搜索、结构化知识表示和持久记忆模块,实现动态证据获取与跨主张证据复用。实验证明,MERMAID在多个基准上达到最先进性能,同时提升检索效率,验证了融合检索、推理与记忆对可靠真实性评估的有效性。

AI 推荐理由

论文核心提出带持久记忆模块的多智能体框架,显式建模证据记忆机制。

论文信息
作者 Yupeng Cao, Chengyang He, Yangyang Yu, Ping Wang, K. P. Subbalakshmi
发布日期 2026-01-29
arXiv ID 2601.22361
相关性评分 9/10 (高度相关)