来源:互联网 更新时间:2026-06-23 14:00
最近,有好几位朋友问起CherryStudio知识库的设置问题。虽然此前已经聊过不少相关内容,但仔细翻看后发现,知识库的
在知识库界面点击“添加”,就会弹出新建窗口。名字可以随意起;至于嵌入模型,如果一时拿不准该用哪个,先选bge系列是个稳妥的选择。
至于如何挑选嵌入模型,后续会在《知识库优化之路(三)》中详细展开,这里先按下不表,直接进入今天的正题。
知识库添加完成后,在模型信息区域会有一个设置按钮。点进去,就进入了知识库参数界面。
这里有一个关键点:
除了嵌入模型之外,知识库可调的参数其实并不多。下面逐一拆解。
这个参数很好理解:当你向大模型提问并启用知识库时,会有几个资料片段随问题一起提交给大模型。
CherryStudio默认值是6段,最大值可以设到30。但请注意——
当然,对话不会只有一轮。多轮下来,就算考虑缓存命中,几毛钱的消耗也跑不掉。
硅基流动对普通版DeepSeek-R1的TPM限制是10000,也就是每分钟最多10000个token(Pro版是每分钟100万个,可以放心用)。试想,问题附带的资料就有15000个token,你的请求还能成功发出去吗?至于其他平台是否有类似限制,暂时没逐一核实,使用时多留心准没错。
之所以没按照界面从上到下的顺序介绍,而是把匹配度阈值放在第二个说,是因为它和“请求文档分段数量”共同决定了最终大模型能收到几个片段。
匹配度阈值就像一个筛子:只有匹配度高于某个百分比的片段,才有资格被提交给大模型。CherryStudio官方可能没有设置默认值,但根据经验,有些匹配度只有30%多的片段也会被搜到——这种基本没有参考价值。
这个参数的范围是0到1:0.1就是10%,0.5就是50%,1就是100%。一般情况下,设置在70%(即0.7)比较合理。但如果知识库资料不够多,设70%可能一条都匹配不到,这时可以适当降到60%或50%。再低,参考价值就大打折扣,纯粹是浪费token了。
所以,
分段的问题之前介绍过,相信大家已经理解了。不理解什么是分段、为什么要分段的,建议先去回顾一下相关内容。
分段大小指的是每个片段的字数。这个参数,
重叠大小和分段大小密切相关。如果分段时只是简单粗暴地按每段500字直接切开,很多句子、段落都可能从中断裂,信息不完整。为了解决这个问题,允许相邻的两个片段在结尾和开头部分有一定内容重复(即重叠),从而减少被拆分的可能,优化分割效果。
在CherryStudio里,想设置重叠大小,必须先设置分段大小。既然分段大小不建议自己改,重叠大小自然也不建议手动调整。既然这两个值都没有动,官方那句“分段大小和重叠大小修改只针对新添加的内容有效”也就可以直接忽略了。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
帅气继父网名女生可爱英文(精选100个)
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
帅到极致的网名女生霸气(精选100个)
如何在夸克浏览器中开启网页视频的倍速播放功能?
作家助手如何上传自制封面 作家助手如何设置小说的封面
蒙古上单是什么梗
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
archiveofourown 实战指南:常见用法整理
韦一敏是什么梗
韩漫小少爷网名大全女生(精选100个)
网络热词聊污是什么意思
抖音最火沙雕男生网名(精选100个)
有寓意的易经网名男生(精选100个)
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
小众游戏抖音网名男生(精选100个)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc