Skip to content

Latest commit

 

History

History
23 lines (17 loc) · 2.55 KB

2312.11242.md

File metadata and controls

23 lines (17 loc) · 2.55 KB

背景

  • 背景
    该论文介绍了 Text-to-SQL 任务的目的是将用户的自然语言查询转换为对应的数据库SQL查询,从而显著增强人类和数据库间的交互。尽管最近的Text-to-SQL方法利用大型语言模型(LLMs)已经展示了显著的性能,但在处理大型数据库、复杂用户查询和错误的SQL结果方面仍面临困难。

  • 已有的工作 现有研究在 LLM-based Text-to-SQL 主要集中在 In-Context 学习提示策略和使用来自目标领域的数据进行监督式微调,但是其存在几个局限性。首先模型的有限上下文窗口限制了其处理大型数据库和表的能力;其次,在单次传递中为复杂用户查询生成SQL时会出现错误;第三,生成的SQL缺乏验证,任何修正都仅依赖于执行错误或异常,没有考虑更全面的修订。

核心贡献

  • 提出了一个 MAC-SQL 框架
    • 挑战1:如何处理大型数据库结构 文中提到的 Selector 代理旨在根据用户的查询简化复杂且冗余的数据库结构,仅保留相关的表和列名信息,有助于实际数据库上下文中输入长度的减少。

    • 挑战2:如何处理复杂用户查询 Decomposer 代理使用链式思考(Chain-of-Thought)技术拆解复杂用户查询,通过多步推理逐步解决问题并生成相应的SQL。特别是在产生复杂和嵌套的SQL查询时效果显著。

    • 挑战3:如何验证和修正生成的 SQL Refiner 代理负责验证生成的SQL,并基于返回的异常或空结果以及对用户查询关注的上下文理解执行必要的修改。如果修复后错误仍然存在,则重复此过程,直到没有错误为止或达到最大尝试次数。

实现与部署

此外,论文中还介绍了一个名为 SQL-Llama 的开源模型,该模型具有数据库简化、问题分解、SQL生成和SQL修正的能力,并已通过使用来自MAC-SQL的代理指导数据进行了监督式微调。作者还公开了用于模型训练的指令数据集。在使用 BIRD 和 Spider 数据集进行实验时,所提出的方法在 BIRD的开发集和测试集上分别实现了59.39%和59.59%的执行准确率。

总结

总体而言,MAC-SQL 框架通过联合智能代理,解决了 Text-to-SQL 任务中的一些关键挑战,如处理大型数据库、复杂查询以及SQL验证和修正问题。还发布了一个开源模型SQL-Llama,该模型展示了鼓励性的结果,并具备与收费模型如GPT-4相媲美的潜力。