摘要
文档问答(DocQA)旨在回答基于给定文档的问题,但现有DocQA智能体缺乏有效的工具利用能力,且多依赖闭源模型。本文提出DocDancer,一个端到端训练的开源文档智能体。我们将DocQA建模为信息检索问题,并设计了一个工具驱动的智能体框架,显式建模文档探索与理解过程。为支持端到端训练,我们提出“探索-合成”数据合成流程,以缓解高质量DocQA训练数据稀缺问题。在MMLongBench-Doc和DocBench两个长上下文文档理解基准上的实验表明,所训练模型具有有效性。进一步分析为智能体工具设计与合成数据提供了有价值的见解。
AI 推荐理由
涉及文档探索与信息整合,隐含短期记忆机制,但未显式研究记忆架构。
论文信息