来源:互联网 更新时间:2026-06-22 18:32
DeepSeek又出手了,而且这次是连续两天、两次降价。在输入输出价格已经打了2.5折的基础上,针对命中缓存的输入部分,又来了个“折上折”,直接再打一折。
这里有个关键点值得划出来:输入缓存的折扣,并没有规定任何时限。
这一点也得到了DeepSeek研究员陈德里的确认——输入缓存是永久降价。官方还为此打上了“AGI for Everyone”的标签,意图相当明确。
有行业学者评价,这一举措可能会彻底改变人们处理AI记忆和上下文的方式。毕竟,成本一直是制约长上下文应用普及的关键门槛之一。
现在回头再看当初发布时那句“迈入百万上下文普惠时代”的口号,似乎有了更实在的注脚。这不仅仅是技术能力的普惠,更是使用成本的普惠。
那么,打折后到底能省多少钱?实际算下来,可能比表面看到的数字还要可观。
以Agent编程任务为例,这类场景有一个显著特点:输入token的比例远高于输出。同时,DeepSeek在缓存优化方面本就做得相当出色,其V4-Pro模型的输入缓存命中率大约在95%,V4-Flash也达到了91%左右。
这意味着,在实际花费中,绝大部分token都是按照“命中缓存的输入”这一最低档价格来计算的。细看价目表会发现,在这一档位上,V4-Pro每百万token只比V4-Flash贵了0.5分钱,性能与成本的权衡变得非常微妙。
此前有测试显示,消耗约3500万token,花费了31.73元。
若将同样的数据交给DeepSeek模型按新价格计算,结果与真实花费相差无几。但关键在于,如果按照这次降价后的新价格来算,完成同样的工作只需要5.34元。
整体节省幅度高达约83%。换句话说,现在只需花费原来17%的成本,就能获得同等的产出。这个降幅,对于高频用户而言,感受会非常直接。
另一项实际测试也印证了这一点。在消耗了1300万V4-Pro token的任务中,缓存命中率小幅提升至96%左右,输出token的占比与降价前测试的情况基本一致。
最终实际花费为2.36元,与理论计算结果基本吻合。这充分说明了新定价策略的稳定性和可预测性。
DeepSeek再次祭出降价大招,在行业内引发震动,这已经不是第一次了。纵观其发展路径,这种激进的商业策略与其技术理念一脉相承:通过底层架构和算法的持续创新,不断压低模型推理的边际成本,并毫不犹豫地将这些成本优势转化为凌厉的市场竞争力。
回溯到2024年8月,DeepSeek就曾对其V3模型大幅降价,直接引发了阿里云、字节跳动等大厂的跟进,拉开了第一轮大模型token价格战的序幕。随后在R1模型发布时,又通过夜间空闲时段额外打折等策略,让价格战的温度再度攀升。
而这一次V4系列的价格调整,对海外用户产生的心理冲击可能更为强烈。如果按美元计价,那小数点后的位数,恐怕得多看几眼才能数清。
有网友总结得很到位,学生、AI初学者以及小型企业将成为最直接的受益者。极高的性价比,使得大规模、长时间调用模型进行实验、开发和部署,不再是一件需要精打细算、畏首畏尾的事情。
市场已经开始期待,等到下半年DeepSeek大规模部署华&为算力之后,价格方面还能带来怎样的惊喜。这场围绕“普惠”的竞赛,显然才刚刚进入一个新的阶段。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
帅气继父网名女生可爱英文(精选100个)
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
帅到极致的网名女生霸气(精选100个)
如何在夸克浏览器中开启网页视频的倍速播放功能?
作家助手如何上传自制封面 作家助手如何设置小说的封面
蒙古上单是什么梗
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
archiveofourown 实战指南:常见用法整理
韦一敏是什么梗
韩漫小少爷网名大全女生(精选100个)
网络热词聊污是什么意思
抖音最火沙雕男生网名(精选100个)
有寓意的易经网名男生(精选100个)
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
小众游戏抖音网名男生(精选100个)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc