MERMAID：基于多智能体迭代知识锚定的记忆增强检索与推理用于真实性评估

摘要

在线内容的真实性评估日益重要。尽管大语言模型（LLMs）在自动事实核查和主张验证方面取得进展，现有方法通常将证据检索视为静态、孤立的步骤，难以跨主张有效管理或复用证据。本文提出MERMAID——一种记忆增强的多智能体真实性评估框架，通过将检索与推理过程紧密耦合，在Reason-Action式迭代流程中整合智能体驱动的搜索、结构化知识表示和持久记忆模块，实现动态证据获取与跨主张证据复用。实验证明，MERMAID在多个基准上达到最先进性能，同时提升检索效率，验证了融合检索、推理与记忆对可靠真实性评估的有效性。

AI 推荐理由

论文核心提出带持久记忆模块的多智能体框架，显式建模证据记忆机制。

论文信息

作者 Yupeng Cao, Chengyang He, Yangyang Yu, Ping Wang, K. P. Subbalakshmi

发布日期 2026-01-29

arXiv ID 2601.22361