摘要
基于大语言模型的文本到SQL系统在学术基准上表现出色,但在复杂的实际企业环境中表现不佳。其主要限制在于依赖静态模式表示,难以解决语义歧义并扩展至大型复杂数据库。为此,我们提出了APEX-SQL,一种基于代理的文本到SQL框架,将范式从被动翻译转向主动探索。该框架采用假设验证循环,使模型推理基于真实数据。在模式链接阶段,使用逻辑规划生成假设,双路径剪枝减少搜索空间,并行数据分析验证列角色,最后进行全局综合以确保拓扑连通性。在SQL生成过程中,引入确定性机制检索探索指令,使代理有效探索数据分布、优化假设并生成语义准确的SQL。实验表明,APEX-SQL在BIRD和Spider 2.0-Snow数据集上的执行准确率分别达到70.65%和51.01%,优于现有基线方法,且减少了token消耗。进一步分析表明,代理探索作为性能增强手段,释放了基础模型在企业环境中的潜在推理能力。
AI 推荐理由
论文核心聚焦于通过代理探索提升LLM的推理能力,解决语义模糊和复杂数据库问题。
论文信息