来源:互联网 更新时间:2026-06-13 13:58
导读
这两年大语言模型(LLM)的爆发,给数据分析领域带来了久违的新鲜感。从传统BI到敏捷分析,再到如今的智能分析,这一路走来,数据的使用门槛其实一直在降。移动互联网的普及让数据量暴增,而大模型的出现更是让“自然语言问数据”变得触手可及——用户不用再学复杂的工具,直接用日常说话的方式就能和系统交互。不过,即便是在敏捷分析阶段,还是有不少用户觉得拖拽操作有门槛。而大语言模型在语言理解、逻辑推理和工具调用上的突破,正好补上了这块短板。它可以听懂你的自然语言指令,转化成数据查询,再给出直观的分析结果。这篇文章就来聊聊腾讯基于LLM的智能数据分析平台OlaChat的落地实践,看看它是怎么一步步把“智能BI”变成现实的。
主要内容包括:
大语言模型(LLMs)的快速发展,正在深刻改变商业智能(BI)领域的格局。我们来看看这个转变是怎么发生的,以及它带来了哪些新的机会和挑战。

传统的商业智能体系通常走的是自上而下的路线:业务负责人提需求,开发人员去取数据、做分析,折腾一段时间后把结果反馈回去。这流程不仅慢,沟通成本也高,一个分析需求往往要等上一周甚至更久才能拿到结果。等数据到手,业务决策的黄金窗口可能早就过了。
移动互联网起来之后,数据量猛增,结构也越来越复杂。市场对数据分析的需求变了,催生了敏捷分析——让更多人能自助式地获取数据。通过简单的拖拽操作,用户可以自己探索数据。但调查发现,即便是这么“简单”的操作,对一些用户来说学习成本依然不低。比如要做个环比计算,或者处理一些稍微复杂的逻辑,很多人还是懵的——门槛并没有真正消失。
到了2019年前后,虽然大语言模型还没全面铺开,但自然语言处理领域已经有一些表现出色的模型了。那时业界开始琢磨一件事:怎么让更多人不用学工具也能做数据分析?目标是让每个人都能成为“数据分析师”。智能分析的概念逐渐成形,核心就是简化流程、降低技术门槛。
现在,大语言模型成熟了,智能BI终于迎来了真正的爆发期。它不仅能处理复杂的数据查询,还能跟用户用自然语言聊天——你说一句话,系统直接给你分析结果。效率和体验的提升,都是质的飞跃。
大语言模型的发展,其实是自然语言处理领域几十年积累的结果。理清这个脉络,才能理解它对数据智能分析意味着什么。

最早期的语言模型靠概率计算,比如条件随机场(CRF)和马尔可夫模型。它们基于历史数据,用N-gram来估算词语出现的概率——能力有限,只能做简单的预测。
2013年谷歌发布word2vec,是个里程碑。从那以后,神经网络(比如LSTM)开始大放异彩,语言模型对上下文的理解能力明显增强。
2017年Google推出Transformer架构,紧接着2018年前后出现了BERT、GPT-1/2等模型。参数量一下飙到千万甚至数亿级,这些模型在大量语料上统一训练,然后快速适应不同任务,语言理解能力有了质的飞跃。
GPT-3及其后续版本把参数量推到千亿、万亿级别。一个模型就能在多个任务上都表现不错,不用再为每个任务单独训练模型。文本生成、理解、逻辑推理——这些能力都达到了前所未有的水平。
大语言模型给数据智能分析带来了四个核心改进:

基于腾讯PCG大数据平台部的资产管理平台“Ola”和数据分析平台“灯塔”的丰富元数据及用户行为日志,结合大语言模型的能力,我们构建了OlaChat——一个智能数据分析平台。它能满足用户问数、人群洞察、NL2SQL等需求,真正降低了查数、取数、用数的门槛。
接下来重点讲讲OlaChat平台的落地实践。
OlaChat的核心目标很简单:让用户通过自然语言交互,获得流畅的数据分析体验。系统由多任务对话系统、任务编排引擎、AI工具箱以及底层公共服务几个核心模块组成。下面深入拆解一下它的关键能力和技术架构。
下面具体介绍其中几个关键能力。
多任务对话系统的基础功能包括:拒绝/澄清、引导/推荐。它的一些关键能力:
数据分析中,元数据检索是关键环节。但数据是结构化的(表、字段、指标、维度),传统的非结构化检索方法并不适用。比如表名、字段名、指标名之间有明确的层次,不能简单用embedding去匹配。
通用RAG在元数据检索上的问题在于:
我们设计了两种方案:
两种方案各有优劣:打平方法简单直接,但指标维度组合多了容易爆炸;结构化方法更精准,适合复杂长尾问题。实际应用中可以根据场景灵活切换。

在泛数据分析架构中,底层是指标、库表等元数据,还有画像和历史问答集。这些数据进入标注系统处理后,经过关键词检索、语义检索,再通过知识精简(由元数据RAG实现),最后为上层的指标分析、人群圈选等应用提供支持。
Text2SQL在真实业务场景中面临的挑战不少:
我们最终选择了“微调大模型+Agent”的方案来实现Text2SQL。

高质量数据是模型效果的基础。但开源数据集大多面向英文场景,翻译成中文后结构简单(通常单表,字段不到10个),而实际业务中可能有上百个字段,操作符也很少。这都会导致模型表现不佳。

我们内部建立了一套数据生成流程:
数据增强时重点把握两个点:

经过数据增强后,模型在真实业务数据集上的准确率从GPT-4的32%提升到了52%,还能更好地处理复杂问法、复杂Schema和复杂计算逻辑。

但单独一个大模型很难达到理想效果,原因有三:数据集覆盖不全、语言多样性与歧义、噪音信息干扰。所以我们开发了一套智能体(Agent)流程来辅助大模型生成更高质量的SQL:

我们将这些思想整理成论文:通过信息精简、分类处理、针对性生成和自我纠错来提升模型性能。简单查询和复杂查询采用不同策略,生成时设定条件确保SQL可执行,并实施自我纠错机制让模型反思调整,再配合主动学习(active learning)针对常见问题重点提示,最终将智能体与大模型结合,显著提升了准确率。

用户在做智能分析时,需求远不止text2SQL,还有改写、纠错、优化、解读、问答、补齐等。我们在系统中构建了多个智能体来辅助用户完成这些任务,提升整体效率。

上图展示了OlaChat的整体架构:底层服务、公共服务、Agent层、统一后端、统一前端,以及上层各种应用。各模块协同配合,为用户提供一致、高效的数据分析体验。
A1:取数模型用的是8B参数的小模型,适合快速判断用户意图。NL2SQL则采用70B的模型进行微调。
A2:归因的准确率主要依赖归因工具本身。大模型推理能力虽强,但需要结合外部数据才能提高准确率。我们的做法是:基于归因工具拿到分析数据后,大模型负责中间串联和语言整理,最后呈现给用户。
A3:是的,纠错和解读都用到了大模型。但光靠大模型准确率不够,需要引入更多信息,比如SQL中用到的表的元数据,以及执行过程中的报错信息。不能只用大模型,要根据具体场景补充信息。
A4:直接生成SQL和基于语义层的简化方法各有优势。前者灵活性高,后者适合不熟悉SQL的用户,能有效提效。两种方式可以并存。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
免费影视剧APP推荐
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
抖音最火沙雕男生网名(精选100个)
网络热词聊污是什么意思
帅气继父网名女生可爱英文(精选100个)
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
我的末日校园海斗手游上线时间是哪天
蒙古上单是什么梗
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
免费看电影的软件推荐
韦一敏是什么梗
晨字沙雕网名大全女生(精选100个)
帅到极致的网名女生霸气(精选100个)
短剧《情绪超市》剧情介绍
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc