flowchart reasoning faithful reasoning conversational agent graph execution intent understanding
摘要

流程图导向对话(FOD)系统旨在通过遵循特定领域的流程图来引导用户完成多轮决策或操作过程以实现任务目标。本文将FOD中的流程图推理形式化为在每次对话回合中将用户输入映射到流程图节点,并确保节点转换符合正确的流程路径。尽管近年来大语言模型(LLMs)在任务导向对话系统中取得了进展,但将其适配到FOD仍面临两个限制:(1)LLMs缺乏显式表示和推理流程图拓扑结构的机制;(2)它们容易产生幻觉,导致不忠实的流程图推理。为解决这些问题,我们提出了FloCA,一种零样本的流程图导向对话代理。FloCA使用LLM进行意图理解和响应生成,同时将流程图推理委托给一个外部工具,该工具执行拓扑约束的图遍历,从而确保对话回合间的节点转换忠实且逻辑一致。我们进一步引入了一个基于LLM的用户模拟器和五个新的评估指标,涵盖推理准确性和交互效率。在FLODIAL和PFDial数据集上的大量实验突出了现有基于LLM方法的瓶颈,并展示了FloCA的优越性。

AI 推荐理由

论文聚焦于流图推理的逻辑一致性与忠实性,属于推理能力的核心研究。

论文信息
作者 Jinzi Zou, Bolin Wang, Liang Li, Shuo Zhang, Nuo Xu et al.
发布日期 2026-02-15
arXiv ID 2602.14035
相关性评分 9/10 (高度相关)