文档问答 智能体工具使用
摘要

文档问答(DocQA)旨在回答基于给定文档的问题,但现有DocQA智能体缺乏有效的工具利用能力,且多依赖闭源模型。本文提出DocDancer,一个端到端训练的开源文档智能体。我们将DocQA建模为信息检索问题,并设计了一个工具驱动的智能体框架,显式建模文档探索与理解过程。为支持端到端训练,我们提出“探索-合成”数据合成流程,以缓解高质量DocQA训练数据稀缺问题。在MMLongBench-Doc和DocBench两个长上下文文档理解基准上的实验表明,所训练模型具有有效性。进一步分析为智能体工具设计与合成数据提供了有价值的见解。

AI 推荐理由

涉及文档探索与信息整合,隐含短期记忆机制,但未显式研究记忆架构。

论文信息
作者 Qintong Zhang, Xinjie Lv, Jialong Wu, Baixuan Li, Zhengwei Tao et al.
发布日期 2026-01-08
arXiv ID 2601.05163
相关性评分 5/10 (一般相关)