摘要
尽管大型语言模型(LLMs)可以通过推理和工具使用解决复杂任务,但将这些解决方案准确地转化为结构化的工作流仍具有挑战性。本文将工作流建模为工具使用的序列,并重新表述问题为设计一种既能解决问题又能可靠构建工作流的机制。现有方法在执行过程中构建工作流时,常因两个过程之间的干扰而产生不准确性。为此,我们提出了一种执行-总结(Execute-Summarize, ES)框架,将任务执行与工作流构建解耦:模型首先利用可用工具完成任务,然后独立地从执行轨迹中重建结构化工作流。这种分离提高了工作流的准确性和鲁棒性。我们引入了FlowBench,并通过大量实验表明,我们的方法优于现有方法,为将自由形式的LLM推理嵌入到结构化工作流中提供了一个可靠的范式。
AI 推荐理由
论文聚焦于从LLM推理中生成结构化工作流,属于任务规划与执行分离的核心研究。
论文信息