摘要
在线内容的真实性评估日益重要。尽管大语言模型(LLMs)在自动事实核查和主张验证方面取得进展,现有方法通常将证据检索视为静态、孤立的步骤,难以跨主张有效管理或复用证据。本文提出MERMAID——一种记忆增强的多智能体真实性评估框架,通过将检索与推理过程紧密耦合,在Reason-Action式迭代流程中整合智能体驱动的搜索、结构化知识表示和持久记忆模块,实现动态证据获取与跨主张证据复用。实验证明,MERMAID在多个基准上达到最先进性能,同时提升检索效率,验证了融合检索、推理与记忆对可靠真实性评估的有效性。
AI 推荐理由
论文核心提出带持久记忆模块的多智能体框架,显式建模证据记忆机制。
论文信息