摘要
跨文本、表格和图像的复杂问答任务需要整合多样化的信息源,亟需一种支持专业化处理、协调性与可解释性的框架。本文提出DeALOG,一种用于多模态问答的去中心化多智能体框架。该框架包含表格、上下文、视觉、摘要与验证等专用智能体,通过共享的自然语言日志进行通信,该日志作为持久记忆载体。这种基于日志的方法在无中心控制的情况下实现协同错误检测与验证,提升系统鲁棒性。在FinQA、TAT-QA、CRT-QA、WikiTableQuestions、FeTaQA和MultiModalQA等多个基准上的评估表明其性能具有竞争力。分析证实共享日志、智能体专业化与验证机制对准确率至关重要。DeALOG通过模块化组件与自然语言通信提供了一种可扩展的解决方案。
AI 推荐理由
提出基于共享日志的持久记忆机制,是多智能体协作的核心组件。
论文信息