摘要
基于大语言模型的深度搜索智能体在多步检索、推理和长周期任务执行中展现出强大能力,但其实际失败常源于缺乏对不确定环境下推理与检索状态的监控与调节机制。受认知神经科学启发,人类元认知具有分层结构,结合快速异常检测与选择性触发的经验驱动反思。本文提出DS-MCM框架,在深度搜索中嵌入显式的分层元认知监控机制:包含快速一致性监控器(轻量级检查外部证据与内部推理置信度的一致性)和慢速经验驱动监控器(基于历史智能体轨迹中的经验记忆选择性激活以指导纠正干预)。该机制直接嵌入推理-检索循环,决定何时干预及如何利用先验经验指导修正。在多个深度搜索基准和主干模型上的实验表明,DS-MCM显著提升性能与鲁棒性。
AI 推荐理由
论文核心引入基于经验记忆的监控机制,Memory是关键组成部分。
论文信息