来源:互联网 更新时间:2026-05-30 08:39
聊到大型语言模型在垂直领域的落地,RAG 几乎是一个绕不开的核心组件。从问题诊断到效果调优,涉及的环节相当多。这个系列就以医疗领域为例,把 RAG 相关的实用经验逐步拆解出来——既覆盖理论认知,也包含代码实践。本篇先聚焦理论知识与经验总结,后续会结合最新的优化方法给出详细的优化代码,以及在实践中衍生的思考。
下面是本篇的快速索引:
先看一张经典的流程图,它基本概括了 RAG 的标准工作方式:

具体来说,整个流程可以拆解成这几个环节:

回到 prompt 设计本身,一个典型的模板长这样:
已知信息:{context}
根据上述已知信息,简洁和专业的来回答用户的问题。如果无法从中得到答案,请说 “根据已知信息无法回答该问题” 或 “没有提供足够的相关信息”,不允许在答案中添加编造成分,答案请使用中文。
问题是:{question}
这里的 {context} 就是检索出来的文档内容。
基于 LLM 的文档对话架构,核心可以拆成两步:先检索,后推理。重心其实在前者——检索架构的设计(本质上是一个推荐系统),推理部分交给 LLM 处理就好,现有框架如 LangChain 已经做得很成熟了。
所以接下来重点聊聊检索架构。
一个好的检索系统,需要同时满足三个条件:
具体做法是:把需要建立检索库的文本组织成二级索引。第一级索引是「关键信息」,第二级是「原始文本」,两者一一映射。关键信息用于加速检索和参与向量相似度计算,原始文本则作为 context 返回给 prompt。
向量检索基于关键信息 embedding 进行相似度计算,检索命中后,再通过映射关系把对应的原始文本内容喂给 LLM。
关键信息抽取之前,先要解决文档切分的问题。切分的粒度是个老生常谈的难题——切得太细,跨段落的语义连贯性容易断裂;切得太粗,噪声又太多。因此比较稳妥的做法是按语义进行切分。
拿到文档后,先切分再抽取关键信息。具体是否需要进一步细化到文章、段落甚至句子级别,取决于实际场景。
下面展开讲讲方法和实践中的取舍:
下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
初中英语同步课文跟读APP推荐|免费下载高口碑跟读软件排行榜
BuuPo官网在哪下载 最新官方下载安装地址
4D采矿者官网在哪下载 最新官方下载安装地址
阅读app安卓版下载推荐
碎片人偶Vragmeet官网在哪下载 最新官方下载安装地址
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
无尽花界时装合辑
免费影视剧APP推荐
喧哗番长乙女 2nd Rumble !!官网在哪下载 最新官方下载安装地址
纸嫁衣9官网在哪下载 最新官方下载安装地址
萌神契约手游下载安装
好用的手环阅读app下载安装
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
人声接近真人!OpenAI一口气更新三款超强语音AI
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
短视频软件推荐
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc