来源:互联网 更新时间:2026-05-31 16:28
对企业来说,把分散的知识管起来,这事儿有多重要?一句话总结:内部经验能传承了,重复造的轮子少了,知识本身的活力也就被激活了。而把大模型AI技术装进这个管理框架里,就像是给这套体系装上了“智慧大脑”,它不再只是个存储仓库,而是能实时整合、精准分析、甚至主动输出见解的智能系统。
这篇文章,整理自金山办公AI知识库技术总监陈亮在QCon 2024北京的一场深度分享。我们会聊聊金山办公在AI知识库实战中的一些思考,包括AI到底能在知识库里解决哪些实际问题、背后的技术架构怎么搭、RAG技术怎么落地才不“翻车”,以及我们在调教大模型时踩过的坑和找到的解法。文章完全基于现场实录重新组织。

先说说我们这边的情况。说实话,目前大模型还没真正催生出那种“人人都离不开”的现象级应用产品,金山办公也不例外。去年,我们下了决心全面押注AI,过去一年砸了不少资源,跟客户一起共创、一起落地了一些产品。
在4月份的发布会上,我们正式发布了整个AI 365平台,其中就包括WPS AI。这套方案是企业级的,目标很直接:用AI把生产力提上去,让工作流跑得更顺。从去年下半年开始,我们跟很多企业做了深入合作,把收集到的客户痛点,一步一步转化成标准化的产品方案。在这个过程里,我们确定了三条主要的技术演进路线。
第一个是
AI Hub作为基座,首要任务是让大模型能被安全、可控地调用。打个比方,企业里可能有几百上千个员工都在用AI,谁该用哪个模型、用了多少token、信息安全怎么保障?AI Hub提供了一个平台,让企业能统一管理这些大模型的接入服务,无论是公网、私网还是混合部署,都能搞定。接入之后,还能看到可视化的使用报表,比如每天token消耗了多少,哪些提示词用得最多,管理层一目了然。目前我们已经接入了国内主流的几家大模型厂商,并且支持计费统计,这个对企业来说非常实用。
AI Docs 智能文档库AI Docs是我们的智能文档库,可以说是站在WPS多年的文档处理“家底”上做出来的。金山办公在文档解析上有深厚的积累,无论是文本、表格还是复杂图表,我们都能准确识别和解析。今年整个行业特别强调AI知识库,我们的想法是,让企业各个环节上的文档,通过大模型的加持,真正释放它的价值。过去那些沉睡在硬盘里的文档,现在可以通过结构化的解析,成为AI输入的“养料”。
另外,智能文档库还包含“智能创作”功能。这个功能解决的是“内容生产”问题,尤其在金融、公文、论文这些对格式和风格要求严格的领域,落地的价值非常大。基于明确的来源,我们可以让大模型生成符合特定要求的内容。比如,我要写一篇QCon大会的演讲稿,那我往知识库里丢几份以前的QCon资料,然后通过一些机制,让大模型输出一份符合大会气质的稿子。这个功能的关键实现技术,我们在后面会详细讲。
Copilot最后是Copilot。它基于API、Agent和大模型的架构,能帮企业调用各种工具,完成特定任务。Copilot的目标很明确:取代那些日常的、重复性的简单劳动,降低人力成本。举个内部的例子,如果我想创建明天10点的会议,传统流程我得打开日历、找会议室、创建日程、再一个个通知参会者。但在Copilot上,我只说一句“明天10点帮我创建个会议并发给相关人员”,它就能解析指令,调用365内部的API和组织的通讯录API,直接搞定一切。
这里我想提出一个概念,那就是未来企业级AI的形态:
技术这块,我想从三个具体场景出发,谈谈我们的经验和思考。
首先是
第二个场景是
智能问答是AI知识库的核心应用。它的功能是,在海量知识库里,检索出跟用户问题最相关的内容,然后呈现给用户。甚至还有一个“词条”功能,用户在后台配置后,比如输入某个财务同事的名字,系统就能直接跳转到对应的聊天框。我们的系统还能检索出相关的图片,并引用文档来源。
这个场景有几个关键点。首先是
在文档入库阶段,处理流程如下:
智能创作与智能问答在入口上很相似。用户输入一个主题,或者匹配到推荐的主题,系统就能帮生成符合特定风格和字数要求的文本。生成的内容可以直接填入云文档模板,支持公文、合同、财报等多种类型,并且会附上参考文档来源。这个场景有两个核心要求:
具体实现路径是这样的:
目前,智能创作在财报和公文领域的效果已经比较理想了,但还没正式推向大众。因为在实际应用中,很多专业术语和行业“黑话”需要专门处理。比如金融领域的市盈率、P/E,医药行业特有的专业表述,如果不经过专门的训练,大模型很容易出错。特别是医药行业,对内容准确率的要求可以说是“零容忍”。药品说明书的一个字都不能错,因为它直接关系到用药安全。所以,在这些领域落地前,必须经过严格的多轮验证。
智能简历库智能简历库是我们的一个特色场景。简历的格式相对固定,包含头像、姓名、联系方式、工作经历等结构化信息。但传统的大模型在处理统计类问题时(比如“有多少个硕士”),表现不稳定。所以我们换了一种思路:
我们结合大模型、NLP和NER(命名实体识别)等算法,把简历中的信息提取出来,以结构化的形式存入数据库。当用户提问时,比如“找一个具有AI经验的产品经理”,系统会把问题转化为SQL语句,或者通过向量搜索找到相关简历片段。在结构化抽取阶段,我们使用了Lora微调,目的是让大模型更准确地识别简历中的关键词。我们还生成了简历的总结,这有助于后续进行JD(职位描述)匹配。
JD匹配和字段匹配是两种不同的方式。我们通过语义检索,结合ES(Elasticsearch)技术,可以处理“需要多少年工作经验”这类自然语言描述。这样一来,用户可以精确地查询“有多少硕士以上学历的同学”,系统不仅能准确回答总数,还能列出具体人员。这在传统的大模型语义问答中是很难做到的。当然,我们也面临“问题转化为SQL语句”这个技术稳定性的问题,后续计划通过Lora微调来进一步优化。
经验分享在大模型应用的过程中,我感觉这事儿特别有意思。大模型就像一个知识渊博但有点“老糊涂”的智者,几乎能回答所有问题,但准确性需要我们自己来兜底。为了确保它不出大篓子,我认为应该从四个维度来约束和规范:
在大模型领域,我们经历了第一波以GPT为代表的技术涌现,大家充满了好奇和惊叹。紧接着,第二波应用层的创新开始到来。虽然目前国内上百个大模型里,还没出现真正的“杀手级应用”,但各行各业都已经开始积极尝试,比如金融、医药等。
我的判断是,第二波创新应该
下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
初中英语同步课文跟读APP推荐|免费下载高口碑跟读软件排行榜
BuuPo官网在哪下载 最新官方下载安装地址
4D采矿者官网在哪下载 最新官方下载安装地址
阅读app安卓版下载推荐
碎片人偶Vragmeet官网在哪下载 最新官方下载安装地址
免费影视剧APP推荐
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
喧哗番长乙女 2nd Rumble !!官网在哪下载 最新官方下载安装地址
纸嫁衣9官网在哪下载 最新官方下载安装地址
萌神契约手游下载安装
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
好用的手环阅读app下载安装
人声接近真人!OpenAI一口气更新三款超强语音AI
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
短视频软件推荐
苹果macOS 27将优化界面设计并测试AI驱动的Safari标签页自动分组功能
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc