您的位置：首页 > > 教程攻略 > ai资讯 >急眼的Anthropic炒作蒸馏，背后是叙事权之战

急眼的Anthropic炒作蒸馏，背后是叙事权之战

来源:互联网 更新时间:2026-06-28 14:19

文 | 周天财经

周天财经原创出品

围绕蒸馏的叙事战，又起波澜了。

6月25日，外媒爆出一件事：美国AI公司Anthropic指控阿里巴巴的千问（Qwen）模型「蒸馏」了它的Claude模型。据路透社和《华尔街日报》的报道，Anthropic已经写信给美国参议员和白宫官员，指控阿里在4月到6月间，用25000个虚假账号与Claude进行了大约2880万次交互，试图从中提取Claude的「功力」。

不过，到目前为止，Anthropic并没有拿出什么过硬的实锤证据。仅凭一封信就对另一家公司大肆讨伐，这种操作，已经引发了全球AI社区绝大多数开发者的不满和斥责。

其实，这已经不是Anthropic第一次这么做了。早在今年2月，这家公司就发博客说DeepSeek、Kimi、MiniMax这三家中国公司蒸馏了Claude，和今天对阿里的指控简直是一个模子刻出来的。

当时那三家公司都没怎么吭声，阿里这次也保持了沉默。但有意思的是，就在这个新闻出来的前两天（6月23日），阿里正式对美国国防部提起了诉讼，要求把自己从「中国军事企业名单」里移除。

如果仔细挖一挖细节，这事儿其实可以从两个层面来看。

先说说蒸馏本身。先给结论：蒸馏不能等同于抄袭和窃取，这种行业里最普遍的技术，已经被Anthropic彻底污名化了。

蒸馏（Distill）是AI行业公认的合法训练技术，由AI三巨头之一、诺奖得主Geoffrey Hinton在2015年提出，后来就成了行业的基本操作。

这就像一个「向高手学习」的训练方式：它能帮助模型快速掌握某种回答风格、任务范式和基础能力，也可以把大模型已经表现出来的一些能力，高效地「压缩」到小模型身上。所以蒸馏的核心价值在于提速、降本和能力迁移，它能帮一个模型少走很多弯路，更快接近强模型已经达到的水平。

有个行业皆知的事实：美国AI公司之间也经常互相蒸馏。无论OpenAI、Anthropic，还是Qwen、DeepSeek，模型训练的pipeline其实都差不多。特别是Anthropic，业内人士经常指出，这家公司也到处在蒸馏其他家的成果。

更滑稽的是，前段时间，其Claude Opus 4.8发布后，有开发者调用官方API测试，用中文问「你是什么模型」，结果模型返回的字段是claude-opus-4-8，但输出的回答却说：「我是通义千问（Qwen）」。这事儿在AI社区引发大量讨论，大家纷纷猜测Claude是不是蒸馏了中国模型。随后，陆续又有开发者测到Claude 4.8输出「我是DeepSeek」之类的回答。

就连李开复也在2026年3月的一次采访中直言：「大家可能前一阵听到美国Anthropic抱怨一些中国公司蒸馏了它的模型，蒸馏本身也没有违背什么规则，是不是有点小题大做了呢……Anthropic还欠我3000美元稿费。」

李开复这话的指向很明确——Anthropic因为从盗版网站LibGen和PiLiMi上下载了约48.2万本注册版权书籍来训练模型，被作者们集体诉讼，最终赔了15亿美金才达成和解，这也是美国历史上最大的单笔版权和解案。这种版权侵权可比蒸馏严重多了，是法官的严肃判决。而Anthropic指控阿里，却拿不出实在证据，倒打一耙的操作，从未如此具象化。

蒸馏也不是一锤定音的绝招。AI专家Nathan Lambert就谈到，蒸馏只是模仿，真正的能力来自强化学习的探索，而不仅仅是复制输出。Baseten公司模型训练负责人查尔斯·奥尼尔也表示，单靠知识蒸馏无法构建出顶尖的人工智能系统，这还需要其他几项复杂的底层技术。

打个最通俗的比方：蒸馏就像一个运动员通过看世界冠军的比赛录像、模仿冠军的动作、甚至和冠军一起陪练，来迅速理解高水平选手是怎么发力、怎么选择节奏、怎么处理关键球的。这当然很有帮助，甚至可能让他在短时间内进步明显。

但真正决定他能不能成为世界冠军的，仍然是他自己的体能储备、技术细节、战术素养、心理稳定性、日常训练强度，以及背后完整的教练团队和训练、康复体系。

也就是说，看冠军录像能帮你少走弯路，跟冠军陪练能帮你提高速度，但你最终能不能夺冠，靠的肯定不只是「模仿」这一件事。

真正能把一个模型推到顶尖水平的，通常还包括一整套更底层、更复杂的能力建设过程：大规模预训练奠定的知识底座，高质量数据清洗保证的学习材料，训练配方决定的稳定性与效率，强化学习带来的探索与自我修正能力，评估体系提供的反馈闭环，以及工程优化、推理加速和部署能力所实现的最终落地效果。蒸馏更像是「学经验」；它能帮模型学得更快，但未必能单独决定模型能走多远。

回过头看，为何Anthropic对中国AI公司频频出手？答案其实很明显。中国AI不仅在性能榜单上奋起直追，在全球也越来越受欢迎。全球最大的API三方平台OpenRouter的大模型调用榜，就经常被千问、GLM、Kimi、DeepSeek这些中国大模型霸占。对于暂时领先的Anthropic来说，怎能不急眼？

说完蒸馏这事儿，再来聊聊今天产业竞争背后的屋内大象：地缘压力。

在基础大模型上，中国公司这两年展现出了非常强的追赶能力：在算力并不占优、外部限制不断增强的情况下，依然能通过更高的工程效率、更快的迭代节奏、更灵活的开源策略和更务实的应用导向，把模型能力迅速推近全球前沿。这种逼近，本身就足以让部分海外厂商感到不安。

同时，Anthropic这样的公司，目前正处在复杂的安全审查和政府关系夹缝之中。它必须不断回应来自政府、军方的安全诉求。那么，主动强化「中国威胁」叙事，不仅能够帮助自己在政策语境中占据一个更有利的位置，也可能成为它向华盛顿安全体系、五角大楼递交「可信度」的一种投名状。

考虑到Anthropic已经被美军广泛用于战场之中，作为一种「军火」而深刻卷入政府补助和采购，可以说，

Anthropic就是当代新的军工复合体

，绝非象牙塔里的脆弱白莲花。

近期去了一趟美国，深入交流和观察之后，感受颇多。在美国期间，注意到渲染中国公司威胁论的节目在当地有不少信众。比如旧金山的朋友就展示了一些美国百万大V如何质疑宇树机器人回传数据的（虽然也遇到一位巴基斯坦裔百万粉丝博主，盛赞宇树）。3D打印小巨头拓竹，遭遇的是对其「反开源」的质疑——一项原本为了增进云服务稳定性的技术安排，到欧美开源社区的语境里，被解读成巨头反开源的叙事，甚至也被渲染成地缘整治话题。

无一例外，这些中国标杆科技企业都拿出了前沿产品，却也都因为一些无足轻重的技术细节被恶意攻击，指责其威胁安全。

当叙事权不在自己手里，哪怕在细分市场已经做到全球第一，也依然会争论不断——这是中国企业很长一段时间需要面对的烦恼。

还有个小插曲：入境旧金山时，被带到小黑屋里进行了一番审查。阿sir问出了一个让人印象深刻的句子：「你说你是tech blogger，那为什么你有很多年都没再来过美国？在我看来，你应该年年都来才对」。言下之意，不呆在美国就写不了科技——这流露出一种欧美中心主义视角，他们就是眼神清澈地「看不见」很多趋势。回答他说：中国自己就有大量科技与创业公司，已经够忙活好一阵的了。

一面放大威胁，一面贬低实力、漠视成果——这两件自相矛盾的事儿是怎么融合在同一个指控之中的，令人费解。这种左右脑互搏的程度之深，已经成为普遍的双标现象了。

回看最近的蒸馏争议，同样需要清晰地认识到：今天的大模型竞争已经不再只是实验室里的性能竞争、市场上的产品竞争，它同时还是一场定义权、解释权竞争和合法性竞争。

可以预见的是，蒸馏争议不会是一次偶发事件。围绕蒸馏甚至更多技术细节的叙事战，会层出不穷很长一段时间。阿里巴巴、拓竹、宇树这些科技企业面临的叙事压力，还会在越来越多的前沿中国企业身上经历一遍。长路漫漫，需要这一代人共同面对。

*本文如有提及上市公司，仅作为研究交流用途，不构成推荐股票或相关金融产品的建议。