来源:互联网 更新时间:2026-06-18 14:25
ChatBI 无疑是当前数据领域最炙手可热的话题。从 BI 产品的演进历史来看,它代表着降低数据使用门槛的终极形态。但理想很丰满,现实中的技术挑战和落地痛点,往往比我们想象的要多得多。
今天,我们就深入聊聊滴滴在这条路上的探索与实践。核心内容围绕以下几个部分展开:
1. BI 产品演进及 ChatBI 领域现状
2. 滴滴 ChatBI 的探索与实践
3. 智能 BI 背后的技术演进
4. 问答环节实录

BI 的发展,就是一部不断解放生产力的历史。从早期的固定报表时代,到后来的自助式 BI,用户终于能从无休止的“提需求”中解脱出来。而现在,智能 BI 成为了新的焦点。无论是早年的增强分析,还是当下火爆的 ChatBI,核心目标始终如一:
其实在 2023 年之前,增强分析这个概念就已经存在。它涵盖了智能图表推荐、数据解读、预测、异动归因等能力,背后依赖的是机器学习和规则引擎。但说实话,那段时间这项技术并没有激起太大的波澜。技术有了,但总觉得在帮助用户真正看懂数据、找到根因这件事上,还隔着一层窗户纸。
转折点出现在 2023 年。大语言模型(LLM)的出现,像一根线,把之前零散的增强分析能力全部串了起来。用户可以通过自然语言直接提问,让系统完成数据解读、预测和深度分析。滴滴团队在 2022 年之前就积累了大量增强分析的功能,当开始研发 ChatBI 时,发现这些“老功能”正好成了新系统的坚实底座。
目前行业里,ChatBI 的探索大致分成了两派,各有千秋。
总体的判断是:ChatBI 还处在早期探索阶段,前景光明,但路还很长。
从技术上看:
从应用场景看:
滴滴的 BI 平台演进可以说是行业的一个缩影:从最初的可视化报表,到一站式报表,再到自助分析平台,最终进化到今天的智能分析平台。每一步,都是对用户效率和体验的极致追求。
我们内部的 ChatBI 产品叫“数小智”。它主要有三种产品形态:Copilot、PC 站点和 IM 移动端。核心功能集“找数、分析、SQL 辅助”于一身,All In One。值得一提的是,目前绝大部分流量都是由 Copilot 形态贡献的,这说明用户对这种“跟数据对话”的方式接受度很高。
这段经历中,有几个绕不开的关键点,拿出来聊聊。
这是整个 ChatBI 最难啃的骨头之一。我们从三方面入手:
整个 NL2SQL 流程中,每一步都有损耗。从用户提问到最终渲染出图表,目前数据分析类问题的端到端解决率在 85% 左右。这个数字意味着,对于数据资产标准化不足的企业,要实现理想态的 ChatBI,绝对是个长期工程。必须推动标准指标集建设,快速覆盖关键用数场景,逐步淘汰非标准分析源。
技术探索再热闹,用户不买账就白搭。除了准确性,用户习惯是另一大障碍。很多用户还是习惯用老方法做报表。
我们的解法是:基于 Copilot 形态,设计面向灵活分析场景的产品触点。比如,把它做成报表组件的灵活筛选器;对报表上任一波动字段进行一键归因分析;对数据集或 Hive 表字段进行灵活探查。让用户在原有工作流中,不知不觉就切换到 ChatBI 上了。
问答取数只是第一步,真正的价值在于深度分析。ChatBI 产品必须具备灵活的异动分析和归因能力,而 ChatBI 的形态正好能将这种能力灵活放大。
进一步,我们利用“ChatBI + LLM”的能力,在特定业务场景下每日自动生成业务数据分析日报。这对一线业务团队来说,是实实在在的效率提升。
最终的产品架构,涵盖了 Copilot、PC 站点、IM 移动端三种形态。从数据分析、SQL 编写到数据查找,已经全面落地。从今年公司内部的落地情况来看,基本符合预期。
NL2SQL 问答取数,只是 ChatBI 实现深度分析价值的基础。行业的期待远不止于此。真正的高价值分析,一定是基于具体业务场景的,不是通用的问答就能解决的。这也是为什么 ChatBI 的未来,在于与业务深度绑定。
在分析深度的增强过程中,业务场景和背景知识的融入至关重要。比如,面对能源业务,系统必须理解其特有的关键指标和行业趋势,才能提供有针对性的分析建议,为决策提供有力支撑。未来,这将是 ChatBI 差异化竞争的关键所在。
A1:我们内部的基础模型也是基于开源模型,比如现在用的 LLM 72B,在此基础上进行微调。但说实话,微调数据的积累非常耗时,开源数据集只能提供基础起点,离真实业务场景差距很大,必须自己大量补充。此外,很大程度上取决于你原有的 BI 基础设施。如果 BI 本身建设得就很完善,今天开发 ChatBI 会省力很多。
A2:指标解读包括指标的极值、均值、趋势以及指标间的相关性等基本信息。目前我们能做的,主要还是语义润色层面的改善。要真正发挥大模型价值,必须结合具体的业务背景知识进行数据解读,这也是我们正在思考和实践的方向。
A3:这个问题问得很好。NL2SQL 生成的 SQL 灵活度太高,可能包含子查询甚至多表查询,对底层支持要求非常高。DSL 相对而言能更好地解析这类复杂查询,并且在模糊指标处理上也能做一定优化。还有个历史原因:在 ChatBI 系统建立之前,BI 平台就已经存在这一层,承担着权限校验和与其他系统关联的任务。所以我们在架构中保留了它,实践证明它确实提供了必要的帮助。
以上就是本次分享的内容,谢谢大家。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
帅气继父网名女生可爱英文(精选100个)
帅到极致的网名女生霸气(精选100个)
蒙古上单是什么梗
韩漫小少爷网名大全女生(精选100个)
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
韦一敏是什么梗
网络热词聊污是什么意思
作家助手如何上传自制封面 作家助手如何设置小说的封面
抖音最火沙雕男生网名(精选100个)
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
如何在夸克浏览器中开启网页视频的倍速播放功能?
因空难被判“过失杀人罪” 空客、法航均被顶格处罚22.5万欧元
有寓意的易经网名男生(精选100个)
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
免费看电影的软件推荐
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc