不确定性估计 轨迹分析 工具-智能体交互 推理能力评估
摘要

在现实世界中,AI智能体与人类进行多轮工具交互时,估计其不确定性具有挑战性,因为失败通常由稀疏的关键事件(如循环、不连贯的工具使用或用户-智能体协调失误)触发,而局部生成结果可能显得自信。现有不确定性代理主要关注单次文本生成,忽略了轨迹级别的崩溃信号。本文提出TRACER,一种面向双控工具-智能体-用户交互的轨迹级不确定性度量方法。TRACER结合内容感知的惊讶值、情境感知信号、语义和词汇重复以及工具支持的连贯性缺口,并通过尾部聚焦的风险函数与MAX复合步骤风险进行聚合,以揭示决定性异常。我们在$τ^2$-bench上对TRACER进行了评估,预测任务失败和选择性任务执行。结果表明,TRACER在AUROC和AUARC指标上分别比基线提升了37.1%和55%,实现了更早且更准确地检测复杂对话式工具使用场景中的不确定性。

AI 推荐理由

论文聚焦于Agent在多轮工具使用中的推理不确定性,提出轨迹级风险度量方法,直接关联到推理能力的评估与改进。

论文信息
作者 Sina Tayebati, Divake Kumar, Nastaran Darabi, Davide Ettori, Ranganath Krishnan et al.
发布日期 2026-02-11
arXiv ID 2602.11409
相关性评分 9/10 (高度相关)