RAG 智能体 检索增强生成 分层检索 信息检索
摘要

前沿语言模型已展现出强大的推理和长期工具使用能力。然而,现有的RAG系统未能充分利用这些能力,仍依赖于两种范式:(1)设计一种算法一次性检索段落并将其连接到模型输入中,或(2)预定义工作流程并提示模型逐步执行。这两种范式均不允许模型参与检索决策,从而限制了其随着模型改进而高效扩展的能力。本文提出了A-RAG,一种面向智能体的RAG框架,直接向模型暴露分层检索接口。A-RAG提供了三种检索工具:关键词搜索、语义搜索和块读取,使智能体能够跨多个粒度自适应地搜索和检索信息。在多个开放域问答基准测试中的实验表明,A-RAG在可比或更低的检索token数量下始终优于现有方法,证明了A-RAG有效利用模型能力并动态适应不同的RAG任务。我们进一步系统研究了A-RAG如何随模型规模和测试时计算量扩展。我们将发布我们的代码和评估套件以促进未来研究。

AI 推荐理由

论文提出A-RAG框架,通过分层检索接口增强模型的检索能力,与Agent Memory相关。

论文信息
作者 Mingxuan Du, Benfeng Xu, Chiwei Zhu, Shaohan Wang, Pengyu Wang et al.
发布日期 2026-02-03
arXiv ID 2602.03442
相关性评分 7/10 (相关)