来源:互联网 更新时间:2026-06-16 14:37
这几年Text-to-SQL领域跑得确实快,但真正能打到80%执行准确率的模型,一只手数得过来。Google Research这次拿出的Gemini-SQL2,算是直接把门槛又抬了一截——基于Gemini 3.1 Pro做了专项后训练,在BIRD基准的单模型赛道上,以80.04%的执行准确率登顶。简单说,你对着数据库说人话,它就直接给你生成能跑的SQL查询,省掉了手写语句的功夫。下面这张图展示了模型的核心定位:
作为一款面向真实业务场景的Text-to-SQL模型,它要解决的问题并不算少。核心功能可以拆成这几个维度:
能跑出80%的准确率,靠的不是花哨的集成框架,而是实实在在的模型能力打磨。技术亮点主要集中在三个方面:
目前还没有开放的API接口或产品接入方式,具体怎么用得上,得等谷歌后续公布。对于迫切想尝鲜的团队来说,暂时只能关注官方动态。
在同类产品中,它的几个差异化优势很明显:
说到竞品,不得不提蚂蚁集团和阿里巴巴联合开发的XiYan-SQL。两者走的是完全不同的技术路线,直接对比能看出各自的取舍:
| 维度 | Gemini-SQL2 | XiYan-SQL |
|---|---|---|
开发机构 |
Google Research | 蚂蚁集团 / 阿里巴巴 |
BIRD 执行准确率 |
80.04% |
75.63% |
技术路线 |
单模型专项后训练(Gemini 3.1 Pro) | 多生成器集成框架(ICL + SFT + 选择模型) |
开源情况 |
闭源,无API/模型卡/技术报告 | 开源 |
自研模型 |
无(依赖Gemini 3.1 Pro) | XiYanSQL-QwenCoder系列(3B/7B/14B/32B) |
单模型成绩 |
80.04% | 69.03%(32B微调模型) |
Schema 表示 |
未公开 | 独创M-Schema |
从表格里可以看得很清楚:Gemini-SQL2走的是“单模型精调”路线,靠Gemini底座和专项训练把准确率做到极致,但闭源且缺乏透明度;XiYan-SQL则走“多集成+开源”路线,虽然单模型成绩稍低,但生态开放,社区可以自行部署和二次开发。两者各有取舍,看你的实际需求更侧重哪个方向。
一旦开放接入,它能落地的场景其实很典型:
总的来说,Gemini-SQL2用80%的执行准确率给Text-to-SQL赛道树了一个新标杆。虽然目前还是闭源状态,但技术方向已经非常清晰:单模型后训练+执行验证,就是当前最有效的路径之一。等后续谷歌开放接入,企业级数据查询的体验可能真的要被重新定义了。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
网络热词聊污是什么意思
帅气继父网名女生可爱英文(精选100个)
抖音最火沙雕男生网名(精选100个)
蒙古上单是什么梗
帅到极致的网名女生霸气(精选100个)
韦一敏是什么梗
作家助手如何上传自制封面 作家助手如何设置小说的封面
免费看电影的软件推荐
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
因空难被判“过失杀人罪” 空客、法航均被顶格处罚22.5万欧元
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
网石18禁MMO《RAVEN2:渡鸦》大型更新推出全新职业“军阀”
有寓意的易经网名男生(精选100个)
韩漫小少爷网名大全女生(精选100个)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc