摘要
自然语言到SQL(NL2SQL)翻译使非专家用户能够通过自然语言查询关系数据库。近年来,借助大语言模型(LLMs)的推理能力,NL2SQL代理在该任务上取得了显著进展。然而,面对大规模真实世界数据库时,这些代理仍会因缺乏正确利用底层数据的知识(如各列意图)而产生错误。先前的研究尝试生成关于数据库的事实以提供更多信息,但未能解决代理的误解问题。本文提出Tk-Boost框架,通过“部落知识”增强任何NL2SQL代理,即基于使用数据库的经验积累的、用于纠正代理误解的知识。Tk-Boost首先让代理回答一些查询,分析其错误以识别误解,并生成针对性知识。为实现精准检索,Tk-Boost用适用条件索引这些知识。在回答新查询时,Tk-Boost利用这些知识向代理反馈,从而在SQL生成过程中纠正误解,提高准确性。实验表明,在Spider 2.0和BIRD基准测试中,Tk-Boost分别提升了16.9%和13.7%的准确率。
AI 推荐理由
论文聚焦于提升LLM在NL2SQL任务中的推理能力,通过纠正其对数据库的误解来增强准确性。
论文信息