来源:互联网 更新时间:2026-05-27 20:30
昨天Claude正式开放100万上下文长度的消息,可能被很多人低估了。表面上看,这似乎只是从20万到100万,提升了5倍。但实际情况要复杂得多,也重要得多。
这里有个关键细节:模型的总上下文长度,并不等于你能自由使用的空间。系统提示词、记忆机制、内置技能(skills),以及为压缩处理预留的缓冲区(compact buffer),都会预先占用一部分。这就好比买了一台512G的手机,系统和预装应用已经占去了100G。
在之前的200K(20万)上下文版本中,一次对话刚开启,这些固定开销就可能用掉近25%的额度。真正留给你的项目内容,往往只有100K出头。
现在,上下文提升到1M(100万),这些固定开销的比例被大幅稀释。同样的技能配置下,系统占用可能只占4%。结果就是,你的“可用空间”从大约118K暴增到了923K。
做个简单的除法:923 ÷ 118 ≈
这意味着什么?如果你曾被对话过长触发“compact”(自动压缩)机制所折磨,就能深刻体会。压缩过程并不总是顺畅,有时会直接失败导致对话卡死。你不得不重启对话,手动粘贴上下文,每次操作都伴随着信息损耗。更令人沮丧的是,模型很可能在同一个地方,重复犯下你以为已经纠正过的错误。
现在,这种困扰将大幅减少。
理解这次升级的意义,需要跳出“容量”的思维定式。上下文窗口对模型而言,更像是一张“草稿纸”。
物理学家费曼有一个著名的标准:只有当你能够抛开所有数学符号,用通俗语言把一件事讲清楚时,才算真正理解了它。模型的推理过程与此类似。上下文限制的,远不止是能塞进去多少内容,更关键的是限制了模型进行连续、复杂思考的能力。
想象一下,你正在解一道复杂的数学题,进行到一半时,有人突然抽走了你的草稿纸。你变笨了吗?并没有。但你还能顺利解出那道题吗?恐怕也不能了。
问题出在草稿纸,而不在你的大脑。对于大模型,上下文就是它的草稿纸。记忆不只是存储,更是推理的原材料。要推导出一个结论,前提条件和中间步骤必须被记在某个地方,才能一步步推进。如果每推进一步就忘记一步,那么再强大的算力也无济于事。上下文窗口定义了模型的有效记忆范围,超出这个范围,它就只能依靠猜测。
因此,模型犯的很多错误,根源并非“不够聪明”,而是“看不见”。
上下文越小,这类因信息残缺导致的判断失误就越多。
数据也清晰地支持这一点。Anthropic使用MRCR v2(8针检索)基准进行了测试,任务是在超长文本中同时定位多个隐藏的关键信息。结果颇具说服力:
| 模型 | 256K 性能 | 1M 性能 |
|---|---|---|
Claude Opus 4.6 | 91.9% | 78.3% |
Claude Sonnet 4.6 | 90.6% | 65.1% |
| GPT-5.4 | 79.3%† | 36.6% |
| Gemini 3.1 Pro | 59.1% | 25.9% |
† GPT-5.4的256K数据为其128K–256K区间的均值
一个明显的趋势是:
Claude Code的产品经理Boris Cherny也在社交平台上确认,Opus 4.6的1M上下文现已作为Claude Code
/extra-usage 指令手动开启。
Anthropic引用了一个客户案例:启用1M上下文后,自动压缩事件减少了15%。这与许多用户的直观感受相符。对于需要长期迭代的复杂项目而言,这种稳定性的提升,其价值可能相当于模型本身能力提升了10%-20%。
除了性能,商业策略的转变同样值得关注。现在,无论你提交900K token的请求还是9K token的请求,价格是一样的:
| 服务商 | 长上下文收费策略 |
|---|---|
Anthropic Claude | ✓ 无溢价,与短上下文同价 |
| OpenAI GPT-5.4 | 输入超过272K部分收取2倍单价,输出部分收取1.5倍 |
当OpenAI仍在收取“长度税”时,Anthropic选择了取消。这释放出一个明确信号:长上下文正在从一项“高级功能”转变为顶级模型的“基础能力”。从技术原理上讲,这也本该是模型应具备的基础素质。
对于Claude Code Max(每月100美元档位)的用户来说更简单,1M上下文直接可用,无需额外参数,也无需额外付费。
更新 #1图片/PDF处理上限提升单次上传的图片或PDF文件数量上限从100大幅提升至600。以前处理大量文档时需要手动分批上传,现在可以一次性全部喂给模型。对于需要整理大量截图和参考资料进行写作或分析的工作流来说,这一步直接省去了好几个繁琐环节。 |
更新 #2自适应思考(Adaptive Thinking)转正该功能已结束测试,转为正式版。模型将自行判断何时需要“慢思考”(深入推理),何时可以“快回答”,无需用户手动配置推理深度。这减少了一层不必要的决策,让交互更加流畅自然。 |
AI工具的进步通常有两种路径:一是让模型变得更聪明;二是将模型已有的能力更彻底地释放出来。这次1M上下文的全面开放,显然属于后者。但对于长期项目、复杂开发,以及那些曾被“compact”搞崩过心态的用户而言,这次升级的实际影响,丝毫不亚于一次模型能力的飞跃。
回到费曼的比喻:记住一个公式,与能够从头推导出这个公式,是两件重量完全不同的事。同样,给模型直接喂食答案,与为它提供足以推导出答案的全部信息,也是两种截然不同的范式。后者实现起来更难,但结果无疑更加可靠。
上下文窗口的大小,直接决定了你能为模型提供多少用于推导的信息。在过去,窗口太小,用户不得不做减法——剪掉那些“可能有用但塞不进去”的信息。每一次裁剪,都是一场反赌,赌这段被舍弃的信息不重要。赌赢了,风平浪静;赌输了,模型就会在某个你无法察觉的角落,犯下一个你找不到根源的错误。
现在,情况改变了。你可以更加放心地将任何你认为模型应该知道的信息,完整地提供给它。这种“提供充分上下文,而非施加精细控制”的理念,不仅在Netflix、字节跳动等公司的管理中愈发有效,在大模型的使用范式上也正展现出强大的生命力。
Context, Not Control.
下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
初中英语同步课文跟读APP推荐|免费下载高口碑跟读软件排行榜
4D采矿者官网在哪下载 最新官方下载安装地址
BuuPo官网在哪下载 最新官方下载安装地址
阅读app安卓版下载推荐
碎片人偶Vragmeet官网在哪下载 最新官方下载安装地址
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
喧哗番长乙女 2nd Rumble !!官网在哪下载 最新官方下载安装地址
纸嫁衣9官网在哪下载 最新官方下载安装地址
萌神契约手游下载安装
好用的手环阅读app下载安装
无尽花界时装合辑
人声接近真人!OpenAI一口气更新三款超强语音AI
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
免费影视剧APP推荐
苹果macOS 27将优化界面设计并测试AI驱动的Safari标签页自动分组功能
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc