来源:互联网 更新时间:2026-06-28 14:19
围绕蒸馏的叙事战,又起波澜了。
6月25日,外媒爆出一件事:美国AI公司Anthropic指控阿里巴巴的千问(Qwen)模型「蒸馏」了它的Claude模型。据路透社和《华尔街日报》的报道,Anthropic已经写信给美国参议员和白宫官员,指控阿里在4月到6月间,用25000个虚假账号与Claude进行了大约2880万次交互,试图从中提取Claude的「功力」。
不过,到目前为止,Anthropic并没有拿出什么过硬的实锤证据。仅凭一封信就对另一家公司大肆讨伐,这种操作,已经引发了全球AI社区绝大多数开发者的不满和斥责。

其实,这已经不是Anthropic第一次这么做了。早在今年2月,这家公司就发博客说DeepSeek、Kimi、MiniMax这三家中国公司蒸馏了Claude,和今天对阿里的指控简直是一个模子刻出来的。
当时那三家公司都没怎么吭声,阿里这次也保持了沉默。但有意思的是,就在这个新闻出来的前两天(6月23日),阿里正式对美国国防部提起了诉讼,要求把自己从「中国军事企业名单」里移除。
如果仔细挖一挖细节,这事儿其实可以从两个层面来看。
先说说蒸馏本身。先给结论:蒸馏不能等同于抄袭和窃取,这种行业里最普遍的技术,已经被Anthropic彻底污名化了。
蒸馏(Distill)是AI行业公认的合法训练技术,由AI三巨头之一、诺奖得主Geoffrey Hinton在2015年提出,后来就成了行业的基本操作。
这就像一个「向高手学习」的训练方式:它能帮助模型快速掌握某种回答风格、任务范式和基础能力,也可以把大模型已经表现出来的一些能力,高效地「压缩」到小模型身上。所以蒸馏的核心价值在于提速、降本和能力迁移,它能帮一个模型少走很多弯路,更快接近强模型已经达到的水平。
有个行业皆知的事实:美国AI公司之间也经常互相蒸馏。无论OpenAI、Anthropic,还是Qwen、DeepSeek,模型训练的pipeline其实都差不多。特别是Anthropic,业内人士经常指出,这家公司也到处在蒸馏其他家的成果。
更滑稽的是,前段时间,其Claude Opus 4.8发布后,有开发者调用官方API测试,用中文问「你是什么模型」,结果模型返回的字段是claude-opus-4-8,但输出的回答却说:「我是通义千问(Qwen)」。这事儿在AI社区引发大量讨论,大家纷纷猜测Claude是不是蒸馏了中国模型。随后,陆续又有开发者测到Claude 4.8输出「我是DeepSeek」之类的回答。

就连李开复也在2026年3月的一次采访中直言:「大家可能前一阵听到美国Anthropic抱怨一些中国公司蒸馏了它的模型,蒸馏本身也没有违背什么规则,是不是有点小题大做了呢……Anthropic还欠我3000美元稿费。」
李开复这话的指向很明确——Anthropic因为从盗版网站LibGen和PiLiMi上下载了约48.2万本注册版权书籍来训练模型,被作者们集体诉讼,最终赔了15亿美金才达成和解,这也是美国历史上最大的单笔版权和解案。这种版权侵权可比蒸馏严重多了,是法官的严肃判决。而Anthropic指控阿里,却拿不出实在证据,倒打一耙的操作,从未如此具象化。
蒸馏也不是一锤定音的绝招。AI专家Nathan Lambert就谈到,蒸馏只是模仿,真正的能力来自强化学习的探索,而不仅仅是复制输出。Baseten公司模型训练负责人查尔斯·奥尼尔也表示,单靠知识蒸馏无法构建出顶尖的人工智能系统,这还需要其他几项复杂的底层技术。
打个最通俗的比方:蒸馏就像一个运动员通过看世界冠军的比赛录像、模仿冠军的动作、甚至和冠军一起陪练,来迅速理解高水平选手是怎么发力、怎么选择节奏、怎么处理关键球的。这当然很有帮助,甚至可能让他在短时间内进步明显。
但真正决定他能不能成为世界冠军的,仍然是他自己的体能储备、技术细节、战术素养、心理稳定性、日常训练强度,以及背后完整的教练团队和训练、康复体系。
也就是说,看冠军录像能帮你少走弯路,跟冠军陪练能帮你提高速度,但你最终能不能夺冠,靠的肯定不只是「模仿」这一件事。
真正能把一个模型推到顶尖水平的,通常还包括一整套更底层、更复杂的能力建设过程:大规模预训练奠定的知识底座,高质量数据清洗保证的学习材料,训练配方决定的稳定性与效率,强化学习带来的探索与自我修正能力,评估体系提供的反馈闭环,以及工程优化、推理加速和部署能力所实现的最终落地效果。蒸馏更像是「学经验」;它能帮模型学得更快,但未必能单独决定模型能走多远。
回过头看,为何Anthropic对中国AI公司频频出手?答案其实很明显。中国AI不仅在性能榜单上奋起直追,在全球也越来越受欢迎。全球最大的API三方平台OpenRouter的大模型调用榜,就经常被千问、GLM、Kimi、DeepSeek这些中国大模型霸占。对于暂时领先的Anthropic来说,怎能不急眼?
说完蒸馏这事儿,再来聊聊今天产业竞争背后的屋内大象:地缘压力。
在基础大模型上,中国公司这两年展现出了非常强的追赶能力:在算力并不占优、外部限制不断增强的情况下,依然能通过更高的工程效率、更快的迭代节奏、更灵活的开源策略和更务实的应用导向,把模型能力迅速推近全球前沿。这种逼近,本身就足以让部分海外厂商感到不安。
同时,Anthropic这样的公司,目前正处在复杂的安全审查和政府关系夹缝之中。它必须不断回应来自政府、军方的安全诉求。那么,主动强化「中国威胁」叙事,不仅能够帮助自己在政策语境中占据一个更有利的位置,也可能成为它向华盛顿安全体系、五角大楼递交「可信度」的一种投名状。
考虑到Anthropic已经被美军广泛用于战场之中,作为一种「军火」而深刻卷入政府补助和采购,可以说,

近期去了一趟美国,深入交流和观察之后,感受颇多。在美国期间,注意到渲染中国公司威胁论的节目在当地有不少信众。比如旧金山的朋友就展示了一些美国百万大V如何质疑宇树机器人回传数据的(虽然也遇到一位巴基斯坦裔百万粉丝博主,盛赞宇树)。3D打印小巨头拓竹,遭遇的是对其「反开源」的质疑——一项原本为了增进云服务稳定性的技术安排,到欧美开源社区的语境里,被解读成巨头反开源的叙事,甚至也被渲染成地缘整治话题。
无一例外,这些中国标杆科技企业都拿出了前沿产品,却也都因为一些无足轻重的技术细节被恶意攻击,指责其威胁安全。
当叙事权不在自己手里,哪怕在细分市场已经做到全球第一,也依然会争论不断——这是中国企业很长一段时间需要面对的烦恼。
还有个小插曲:入境旧金山时,被带到小黑屋里进行了一番审查。阿sir问出了一个让人印象深刻的句子:「你说你是tech blogger,那为什么你有很多年都没再来过美国?在我看来,你应该年年都来才对」。言下之意,不呆在美国就写不了科技——这流露出一种欧美中心主义视角,他们就是眼神清澈地「看不见」很多趋势。回答他说:中国自己就有大量科技与创业公司,已经够忙活好一阵的了。
一面放大威胁,一面贬低实力、漠视成果——这两件自相矛盾的事儿是怎么融合在同一个指控之中的,令人费解。这种左右脑互搏的程度之深,已经成为普遍的双标现象了。
回看最近的蒸馏争议,同样需要清晰地认识到:今天的大模型竞争已经不再只是实验室里的性能竞争、市场上的产品竞争,它同时还是一场定义权、解释权竞争和合法性竞争。
可以预见的是,蒸馏争议不会是一次偶发事件。围绕蒸馏甚至更多技术细节的叙事战,会层出不穷很长一段时间。阿里巴巴、拓竹、宇树这些科技企业面临的叙事压力,还会在越来越多的前沿中国企业身上经历一遍。长路漫漫,需要这一代人共同面对。
*本文如有提及上市公司,仅作为研究交流用途,不构成推荐股票或相关金融产品的建议。
archiveofourown 实战指南:常见用法整理
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
电视剧《小欢喜》剧情介绍
如何在夸克浏览器中开启网页视频的倍速播放功能?
作家助手如何上传自制封面 作家助手如何设置小说的封面
全链网:黄金价格因美元的走强及利率担忧而下跌
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
有寓意的易经网名男生(精选100个)
植物娘大战僵尸电脑端与手机端存档转移的方法
网石18禁MMO《RAVEN2:渡鸦》大型更新推出全新职业“军阀”
动漫《柚木家的四兄弟》剧情介绍
《梦幻西游》159五开五门怎么搭配-159五开五门常见搭配
拼多多品牌好货是官方店铺吗?拼多多品牌好货是官方还是自营店铺
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
腾讯元宝怎么用来分析股票基金的基本面信息?
美好的简约网名男生(精选100个)
独家/李宰旭入伍前「登上孤岛服役」 惊见前辈裸体:忍不住笑了
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc