谷歌Gemini-SQL2模型Text-to-SQL准确率达80.04%，刷新BIRD基准记录

6月12日，Google Research发布基于Gemini3.1 Pro优化的Gemini-SQL2模型，专攻自然语言转SQL任务。该模型在权威基准BIRD上实现80.04%执行准确率，超越前代产品，可支持业务人员以口语化方式查询数据，适用于数据分析等场景。

自然语言转SQL（Text-to-SQL）技术是连接非技术人员与数据库的关键桥梁——它的核心价值，就在于让不懂结构化查询语言（SQL）的业务人员，能用口语化的表述直接获取数据洞察。6月12日，Google Research正式发布Gemini-SQL2模型，这款工具基于Gemini 3.1 Pro基础模型优化而成，专门针对Text-to-SQL任务中的复杂场景问题展开设计。

Gemini-SQL2的核心性能，在权威评测基准BIRD上得到了直观体现：它的执行准确率达到80.04%，明显超过前代Gemini-SQL模型。作为Text-to-SQL领域的重要评测标准，BIRD基准覆盖了95个真实数据库、37个专业领域（如金融、医疗、电商等）、12751组问答对，数据总量达33.4GB；其高度真实的场景设计，让它成为检验模型能力的关键标尺。这个准确率意味着，模型能正确理解业务需求并生成对应的SQL语句，且执行结果与预期一致的比例超过八成，大大减少了人工校验的成本。

从技术层面看，Gemini-SQL2依托Gemini 3.1 Pro的多模态能力做了专项优化，重点针对Text-to-SQL任务中的语义理解、表结构映射、复杂条件组合等难点展开训练。比如，当业务人员提出“查询过去三个月华东地区的用户流失率及营收变化”时，模型需要先拆解自然语言里的时间范围（过去三个月）、地域（华东地区）、核心指标（用户流失率、营收变化），再对应到数据库的表结构，生成包含JOIN、WHERE、GROUP BY等复杂操作的SQL语句。这样的优化，让模型在处理跨表查询、嵌套条件这类复杂场景时，表现更稳定可靠。

Gemini-SQL2的应用价值，主要落在提升业务效率上。传统数据分析流程里，业务人员得把需求传给数据工程师，再由工程师写SQL查询，这个过程常常要花数小时甚至几天。但Gemini-SQL2能让业务人员直接输入口语化需求，快速拿到查询结果，很适合自助报表生成、实时业务监控这类场景。比如市场部门的人，用“显示上周各产品转化率Top5”的指令就能直接拿到数据，不用再依赖技术团队。

需要注意的是，谷歌目前还没公布Gemini-SQL2的API接入方式、模型卡细节，或是落地产品计划——这说明模型还处在技术验证阶段，离大规模商业应用可能还有段距离。从行业趋势来看，Text-to-SQL已经成为大模型垂直化应用的重要方向：OpenAI的GPT-4曾在BIRD基准上达到约75%的准确率，国内的百度文心一言、阿里通义千问也推出了相关功能，只是具体性能数据还没公开。谷歌这次发布Gemini-SQL2，进一步巩固了它在大模型垂直任务优化领域的领先位置，也让我们看到Text-to-SQL技术会朝着更高准确率、更复杂场景的方向走下去。