自然语言转SQL(Text-to-SQL)技术是连接非技术人员与数据库的关键桥梁——它的核心价值,就在于让不懂结构化查询语言(SQL)的业务人员,能用口语化的表述直接获取数据洞察。6月12日,Google Research正式发布Gemini-SQL2模型,这款工具基于Gemini 3.1 Pro基础模型优化而成,专门针对Text-to-SQL任务中的复杂场景问题展开设计。
Gemini-SQL2的核心性能,在权威评测基准BIRD上得到了直观体现:它的执行准确率达到80.04%,明显超过前代Gemini-SQL模型。作为Text-to-SQL领域的重要评测标准,BIRD基准覆盖了95个真实数据库、37个专业领域(如金融、医疗、电商等)、12751组问答对,数据总量达33.4GB;其高度真实的场景设计,让它成为检验模型能力的关键标尺。这个准确率意味着,模型能正确理解业务需求并生成对应的SQL语句,且执行结果与预期一致的比例超过八成,大大减少了人工校验的成本。
从技术层面看,Gemini-SQL2依托Gemini 3.1 Pro的多模态能力做了专项优化,重点针对Text-to-SQL任务中的语义理解、表结构映射、复杂条件组合等难点展开训练。比如,当业务人员提出“查询过去三个月华东地区的用户流失率及营收变化”时,模型需要先拆解自然语言里的时间范围(过去三个月)、地域(华东地区)、核心指标(用户流失率、营收变化),再对应到数据库的表结构,生成包含JOIN、WHERE、GROUP BY等复杂操作的SQL语句。这样的优化,让模型在处理跨表查询、嵌套条件这类复杂场景时,表现更稳定可靠。
Gemini-SQL2的应用价值,主要落在提升业务效率上。传统数据分析流程里,业务人员得把需求传给数据工程师,再由工程师写SQL查询,这个过程常常要花数小时甚至几天。但Gemini-SQL2能让业务人员直接输入口语化需求,快速拿到查询结果,很适合自助报表生成、实时业务监控这类场景。比如市场部门的人,用“显示上周各产品转化率Top5”的指令就能直接拿到数据,不用再依赖技术团队。
需要注意的是,谷歌目前还没公布Gemini-SQL2的API接入方式、模型卡细节,或是落地产品计划——这说明模型还处在技术验证阶段,离大规模商业应用可能还有段距离。从行业趋势来看,Text-to-SQL已经成为大模型垂直化应用的重要方向:OpenAI的GPT-4曾在BIRD基准上达到约75%的准确率,国内的百度文心一言、阿里通义千问也推出了相关功能,只是具体性能数据还没公开。谷歌这次发布Gemini-SQL2,进一步巩固了它在大模型垂直任务优化领域的领先位置,也让我们看到Text-to-SQL技术会朝着更高准确率、更复杂场景的方向走下去。






快报