来源:互联网 更新时间:2026-06-12 14:18
最近在折腾一个自动驾驶业务的数据仓库升级。说起来都是泪,这仓库一开始就没怎么系统设计,不同车型的数据处理链路长得都差不多,但每个车型都有一堆功能重复、逻辑雷同、名字还特别像的数据表,光表名就上百个。我们除了打算做中间层来复用,还想着能不能靠大模型搞个Text-to-SQL,让数据分析师直接说人话就能查数据,省去那些认知负担,提升运营效率。调研的时候,发现Uber的一篇博客介绍了他们内部的QueryGPT,思路跟我们想得很像,很有参考价值。今天就结合自己的阅读心得,聊聊这个QueryGPT。
首先得说,这可不是什么实验室里的Demo,而是Uber内部已经在用的实战工具。官方数据是,他们每个月要处理120万次数据查询,光是运营团队就占了36%。想想看,一家体量这么大的公司,敢把核心数据查询交给AI来处理,这事儿本身就很有意思。
更关键的是效果。原本写一条SQL查询需要10分钟,现在3分钟就能搞定。做过数据分析的都懂,这效率提升有多夸张。他们内部小范围测试时,每天大概有300个活跃用户,其中78%的用户反馈说这工具确实帮他们省了大把时间。
从技术架构看,QueryGPT的设计很有借鉴意义。它没有简单地把问题甩给大语言模型,而是设计了一套多阶段、智能化的处理流程。
这种多Agent协作的设计特别有想象力。每个Agent专注自己的任务,又能无缝配合,最终输出高质量的SQL。而且,这种设计大大降低了“幻觉”的风险,因为每个环节都有明确的约束和验证机制。
QueryGPT的架构不是一天建成的,而是经历了20多个版本的迭代才走到今天。这个过程完整展示了企业级AI应用从概念验证到生产系统的完整路径。
最初版本其实出奇地简单:只用了7个核心数据表和20个SQL样本,采用基础的RAG(检索增强生成)系统,做了简单的向量相似度搜索。这个版本虽然简陋,但关键验证了可行性。有趣的是,它在小规模场景下表现还不错。
但当他们开始扩大规模时,三个典型问题就冒出来了:
这些问题很有代表性,相信很多做企业AI应用的团队都深有体会。
Uber团队的解决方案很优雅,核心就两点:
用户自然语言问题
→ Intent Agent(理解查询意图并确定业务领域)
→ Table Agent(选择和确认相关数据表)
→ Column Prune Agent(优化表结构和字段选择)
→ SQL Generation(生成最终查询)
这种流水线设计的优势很明显:每个Agent职责单一,便于优化和维护;Agent之间相互配合,形成了强大的错误校正机制;用户也能在关键节点介入和调整。
下图是Table Agent和用户的互动:
Uber团队在评估上做得也很到位。他们采用两种评估流程:
评估指标包括:
特别值得一提的是,他们使用了基于LLM的相似度评分,来比较生成的SQL与标准SQL的差异,这确实是个很有创意的做法。
评估过程中也有一些有趣的发现:
从技术栈来看,Uber选的是:OpenAI的GPT-4 Turbo(128K上下文窗口)、向量数据库存储SQL样本、多个专门的AI Agent协作。
这些选择背后的考虑很值得分析:
这个项目给我们几个重要启示:
如果想开发类似系统,有几点建议值得参考:
当然,这个系统也不是完美的:
展望一下,QueryGPT这类系统未来可能会朝着几个方向演进:
QueryGPT是企业级AI应用的一个优秀范本。它告诉我们如何把AI技术落地到具体业务场景,如何平衡效率和可靠性,以及如何循序渐进地推进AI项目。对于正在考虑AI转型的团队来说,这个项目提供了大量可借鉴的实战经验。
如果对某个技术细节感兴趣,欢迎留言交流。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
免费影视剧APP推荐
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
抖音最火沙雕男生网名(精选100个)
帅气继父网名女生可爱英文(精选100个)
网络热词聊污是什么意思
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
免费看电影的软件推荐
我的末日校园海斗手游上线时间是哪天
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
晨字沙雕网名大全女生(精选100个)
短剧《情绪超市》剧情介绍
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc