GraphRAG 知识图谱 检索增强生成 基准测试
摘要

基于图的检索增强生成(GraphRAG)将外部知识组织为层次化图结构,以高效检索并聚合分散于多文档中的证据。然而,现有GraphRAG基准多依赖短小、人工整理的段落,难以在包含长上下文和大规模异构文档的真实场景中有效评估系统性能。为此,本文提出WildGraphBench基准,利用维基百科文章与其外部参考文献之间的结构关系构建贴近现实的评测环境。该基准涵盖12个顶层主题,以外部参考文献作为检索语料库,引用链接的陈述作为真值,共生成1,100个问题,分为单事实问答、多事实问答和段落级摘要三类复杂度。实验表明,当前GraphRAG流程在中等数量来源的多事实聚合任务中表现良好,但在摘要任务中可能因过度强调高层陈述而忽略细粒度细节。

AI 推荐理由

涉及外部知识存储与检索机制,属于记忆相关应用但非核心记忆架构研究。

论文信息
作者 Pengyu Wang, Benfeng Xu, Licheng Zhang, Shaohan Wang, Mingxuan Du et al.
发布日期 2026-02-02
arXiv ID 2602.02053
相关性评分 6/10 (相关)