Agent Memory 多模态语料库 双策略代理 会议系统 评估协议
摘要

企业会议环境需要能够在严格延迟、成本和隐私约束下处理多样化操作任务的人工智能助手,例如实时讨论中的快速事实核查以及跨会议分析用于战略规划。现有会议基准主要集中在简化的问答任务上,未能反映真实企业工作流程中由多方协作产生的有机查询、长时序上下文和工具增强推理的需求。本文通过构建一个基于实际数据集和学习代理框架来弥补这一差距。首先,我们引入了MeetAll,这是一个从231场企业会议(总计140小时)中衍生出的双语多模态语料库。问题注入采用经过领域专家验证的企业导向协议,并通过人类可区分性研究进行校准。其次,我们提出了MeetBench XL,一种与人类判断对齐的多维评估协议,用于衡量事实准确性、意图一致性、响应效率、结构清晰度和完整性。第三,我们提出了MeetMaster XL,一种学习型双策略代理,能够联合优化快速与慢速推理路径之间的查询路由及工具调用,包括检索、跨会议聚合和网络搜索。轻量级分类器实现了准确的路由,具有最小开销,在质量与延迟之间取得了优于单模型基线的平衡。实验结果表明,该方法在商业系统上表现一致提升,并通过消融实验、鲁棒性测试和现实部署案例加以支持。

AI 推荐理由

论文涉及Agent在会议场景中的记忆与推理机制,但非核心研究主题。

论文信息
作者 Yuelin Hu, Jun Xu, Bingcong Lu, Zhengxue Cheng, Hongwei Hu et al.
发布日期 2026-02-03
arXiv ID 2602.03285
相关性评分 6/10 (相关)