DocDancer：面向基于文档的主动信息检索智能体

文档问答智能体工具使用

摘要

文档问答（DocQA）旨在回答基于给定文档的问题，但现有DocQA智能体缺乏有效的工具利用能力，且多依赖闭源模型。本文提出DocDancer，一个端到端训练的开源文档智能体。我们将DocQA建模为信息检索问题，并设计了一个工具驱动的智能体框架，显式建模文档探索与理解过程。为支持端到端训练，我们提出“探索-合成”数据合成流程，以缓解高质量DocQA训练数据稀缺问题。在MMLongBench-Doc和DocBench两个长上下文文档理解基准上的实验表明，所训练模型具有有效性。进一步分析为智能体工具设计与合成数据提供了有价值的见解。

AI 推荐理由

涉及文档探索与信息整合，隐含短期记忆机制，但未显式研究记忆架构。

论文信息

作者 Qintong Zhang, Xinjie Lv, Jialong Wu, Baixuan Li, Zhengwei Tao et al.

发布日期 2026-01-08

arXiv ID 2601.05163