您的位置:首页 > > 教程攻略 > ai资讯 >专访火山引擎谭待:模型好对MaaS是最重要的事,豆包2.1算「上牌桌」了
专访火山引擎谭待:模型好对MaaS是最重要的事,豆包2.1算「上牌桌」了
来源:互联网
更新时间:2026-06-26 14:14
# 文 | 邓咏仪
# 编辑 | 张雨忻

火山引擎总裁谭待 来源:火山引擎
过去三年,火山引擎总裁谭待给团队定MaaS(模型即服务)营收目标的过程,几乎成了每年必演的“剧本”:年初扔下一个高得让人皱眉的数字,团队集体觉得“这不可能”;到了年中,进度条居然快拉满了,目标于是又被抬高一截。
2026年初,字节的视频模型Seedance 2.0给火山引擎打响了漂亮的开门红。作为云市场的后来者,这只“靠AI起跳”的队伍,交出了让行业侧目的成绩单。
“两年前我就和团队说MaaS是个大生意,当时没人信。”谭待说得云淡风轻,但数据不会骗人——从2025年下半年起,Coding和视频模型终于解锁了商业化生产场景。市场逐渐意识到:模型的能力边界远比想象中更宽,而顶尖模型,是目前MaaS服务最核心的增长引擎,甚至没有之一。
6月23日的火山引擎Force大会上,字节新一代旗舰模型豆包大模型2.1 Pro正式登场。这标志着字节在视频生成之外,模型侧终于把Coding这块拼图给补上了。
谭待对这款新模型的定位很直白:在Coding和Agent能力上,“终于可以上桌了”。在知名编程评测Terminal Bench上,豆包大模型2.1 Pro的表现已能与Claude Opus 4.7基本持平,长程任务和复杂任务都达到了可用门槛。

来源:火山引擎
这恰恰是火山最在意的战场。Coding/Agent能力的进步,意味着模型能真正进入企业和个人的核心生产环节——换句话说,也就是能创造更多商业价值。
除了旗舰模型,火山还带来了一系列更新:Seedance 2.0 4K版、图像生成模型Seedream 5.0、豆包语音生成模型1.0,以及即将在7月发布的Seedance 2.5。
“视频生成模型其实是世界模型的其中一种实现方案,而且从目前来看,是一种比较成熟、可以通过无监督方式进行大规模扩展的技术路径。”谭待解释,Seedance模型对物理世界有精准的还原与理解,这让高质量的视觉数据合成变得可行,也为具身智能、无人驾驶等领域的研究提供了新工具。
回想2024年访谈谭待时,他把大模型比作“大哥大”时代——笨重、昂贵、只有少数人用得起。两年后的今天,已经快进到了“功能机”:大模型不再是少数人的玩物,而是真实地进入了更多人的生活和工作中。
目前,火山在MaaS市场上已经做到了行业领先。最新数据显示,相比2025年底,火山的日均Token消耗量又提升了50%,达到180万亿,较两年前增长超过1500倍;“万亿俱乐部”(累计Token消耗达万亿量级)的客户数也翻了一倍,超过200家。

来源:火山引擎
随着这次发布的模型,以及年内可能推出的新模型,火山的营收目标已经再次上调。
这背后是模型定价逻辑的变化。2024年,火山曾是最早把大模型降到“地板价”的厂商,但这一次大会上,这个话题再没被提起。
“2024年之所以降价,是因为那时所有模型能做的就只有Chatbot,模型就值那个价。”谭待说。但如今,模型已经能够进入核心生产环节。
这也提出了一个更大的问题:当大模型真正进入更多行业的核心生产环节,AI究竟会给云行业带来什么改变?
2024年底,有人曾问谭待:如果卖API就能挣钱,为什么还要做云?后者曾被视作长坡厚雪的好生意,但经过十多年发展,在国内也卷成了红海。
在谭待看来,这个问题本身就不成立。MaaS和云从来不是对立关系——未来的云,很可能是用Agent去调度IaaS、PaaS、SaaS。传统云不会消失,而是会变成AI云的一部分。“基于模型和Agent构建的新负载,可能是传统云的10倍、20倍。”
谭待也反驳了“MaaS服务没有忠诚度”的观点。“云计算早期卖主机的时候也没有粘性,”他说,“现在大家用AI用得还比较浅,一旦模型真正进入一家企业的核心生产系统,耦合性就大了。”
显然,无论火山还是其他云厂商,都把AI视作最重要的、甚至唯一的增长引擎。谭待觉得这是理所当然的:“如果回到2012年字节成立那一年,你会在大做PC搜索吗?”
那么,火山接下来要解决的核心问题就是:如何在这个MaaS市场中持续赢下去?
谭待还没有完整的答案,但有一件事是确定的,也是最难的:让模型长期保持领先。
---
## 一、模型终于真正进入了核心生产环节
过去一年,火山引擎的增长速度令人瞩目。核心驱动力来自哪里?从数据来看,答案很清晰:模型解锁了真正的生产级场景,进入了核心生产环节。越是有挑战、有价值的生产力场景,解锁后带来的价值就越大。
一条主线是视频生成。Seedance是全球第一个真正解锁了商业化生产场景的视频模型。另外一条主线是LLM/Agent——这个生产级解锁,发生在去年Claude Opus 4.6之后。有个细节很能说明问题:根据Cursor的分析,在Claude Opus 4.6出来之前,点Tab补全代码的比例高于Agent自动完成;但之后,两种模式的比例发生了逆转。这证明4.6之后,模型能力有了质的飞跃,能真正用于生产级的Coding和Agent场景。
如何判断Seedance 2.0确实达到了商业化生产的水准?从用户用量就能看出端倪:之前,大多数视频模型只能生产娱乐性的UGC或PGC内容,很难用到严肃创作场景,比如电影、电视剧、广告。而Seedance 2.0发布后,用户行为发生了明显变化:以前视频生成模型的用量在周末大于工作日,和娱乐类C端产品没什么区别;但Seedance 2.0之后,工作日负载反而比周末大两倍以上——这证明大家真的在用它在工作。
视频生成也是通往世界模型的路径之一,在实体产业中潜力巨大。Seedance已经在具身智能、工业制造、智能驾驶等领域落地,为数据合成、场景仿真、流程演示等业务需求提供了新工具。
那么,Seedance 2.0出来前,内部有没有预料到它会这么成功?“也不算大爆吧,”谭待说,“我们本来的目标定得比现在更激进,现在完成起来还是有点挑战的。”
为什么Seedance 2.0能做到这么好?关键在于综合能力。做好视频生成,需要有好的语言模型作为基础,同时图片生成和VLM(视频理解模型)的能力也要够强。Seedance 2.0依托了豆包本身的能力,这是相比单纯做视频模型的垂直公司的重要优势。还有一个因素:中国的内容创作领域在全球范围内都极其活跃,这种土壤让中国最早做出了顶尖的视频模型。
不过,科技圈似乎已经有了“视频生成战争已告一段落,字节占据统治地位”的论调。谭待并不认同:“还没到那个阶段。整个AI在视频生成上的渗透率其实还非常低。”他认为外界过于关注Seedance的短期收入,忽视了它的技术价值。视频生成是一种能够通过无监督方式大规模扩展的技术方案,在实体产业中应用潜力巨大。AI真正创造价值,不是替代过去,而是让整个行业变得更大。
这次Force大会发布的豆包大模型2.1 Pro,被定义为什么水平?谭待说,它已经达到可用标准,可以对标Claude Opus 4.6,进入了Agent的可用门槛。更重要的是,它标志着字节在Coding领域真正上牌桌了——“国内真上牌桌的还没有几个。”
“可用”的标准是什么?谭待列出了几个关键点:
第一,Coding能力强。在数字世界里,Coding能力强意味着能灵活调用脚本、调用工具,泛化能力强。
第二,能完成复杂的通用Agent任务。这需要更好地调用工具、具备长程任务能力、与记忆相结合、适配各种Harness和框架,还要有很好的VLM能力——很多输入需要通过视觉处理,比如Computer Use。
第三,具备可规模化应用的能力。模型再好,如果价格太贵、延迟太高、吞吐量不足,都不行。
豆包大模型2.1在这些方面都做得不错。Coding能力已经能超过Claude Opus 4.6。规模化应用方面,豆包App刚上线的任务模式就是用豆包大模型2.1来做的。
那么,中国模型在Coding场景什么时候才算真正追上来了?谭待预测:“大概会在今年Q2的时候。”虽然很多模型都说要“比肩”谁谁谁,但光说没用。如果真追上了甚至超越了,大家会为你付费——看ARR就知道有没有做到。
为什么国内在Coding场景上整体速度比视频慢?原因有二:一是全球范围内LLM的竞争更激烈;二是起步晚,Anthropic和OpenAI起步早得多,Coding方向也是他们最早定义和发力的。起步晚,现在进度落后很正常,这本来就是一件很难的事。
原来Seed还有单独的Coding模型SeedCode,现在还会做吗?豆包大模型2.1发布后就没有了——Coding和Agent能力都整合到主版本里去了。模型迭代太快了,不想等一两个月才发一次版,所以推出了新的系列叫Seed Evolving,在豆包大模型2.1的基础上每一两周更新一次。
这个系列是主要面向开发者的吗?不只是开发者。有的企业追求模型稳定,直接用豆包大模型2.1就行。但还有很多人希望始终用到最新最智能的版本,Seed Evolving就是满足他们的——但它不是小白鼠版本,会有严格的评估。
现在两条生产级场景的主线都解锁了,LLM和视频生成哪个更重要?站在谭待的角度,LLM更重要一些,它能创造的价值空间更大。“虽然目前Seedance卖得多一点,但我希望后面LLM能成为大头。”
---
## 二、要让模型充分释放能力,还需要一个“中间层”
一个市场共识是:现在是模型牵引产品增长的年代。模型足够SOTA就能卖得好,那火山的价值怎么体现?谭待认为,能做的其实有很多——“模型能力越强,责任越大。”
比如春节前Seedance 2.0火了,但火山的API到4月份才推出,晚了将近两个月。这段时间主要在做什么?版权保护。模型推理要做好,Guardrail(模型护栏)也很重要。
从LLM来看,模型能力其实是通过Harness才充分释放出来的。现在Seedance还缺少一层属于它的Harness。火山最近在思考:应该怎样和行业结合,把不同模型的这层Harness做起来?现在有FDE(前沿部署工程师)团队在各个行业里做这件事。
各行各业需要什么样的Harness?在影视创作领域,很多数字资产没有被管理起来,很多技能也没有积累下来,这些都限制了模型的发挥。未来在视频创作领域,也会有类似Claude Code的东西出现。
视频领域的Harness必须字节自己做吗?谭待说,会和大家一起合作,关键是要找到懂这个事情的人。Coding领域因为程序员很懂,所以能做出对应的Harness;视频创作领域也一样,得懂创作流程。最近火山就在努力给团队招导演。
这次Seedance新上线的“3D白模预演”功能,就来自一位业内知名导演(也是火山引擎客户)的建议。科幻电影里有个重要制作环节叫“白模”,用来表达场景、人物关系和剧情推进。把白模作为参考直接让模型生成对应镜头——这是全球第一个在视频模型上实现这个功能的。
那么视频模型的能力是不是还没有被充分释放出来?不能这么说。视频模型在国内落地速度很快,因为有一个不错的中间层——中国的视频创作领域一直很活跃,创作者能敏感地知道如何利用这些新技术,把API变成内容,最终实现商业落地。当然,火山在这个过程中还有优化空间。
LLM的落地难也是因为没有中间层吗?如果SaaS生态足够好,是可以做一个桥梁的。但国内SaaS基础比较薄弱,终端企业直接使用API有难度。反过来说,这也意味着有弯道超车的机会。
企业客户现在最关心的是“模型怎么落地”的问题吗?大家都相信AI,但AI在企业里到底怎么落地,确实很多人还不清楚。有一类场景已经走通了从0到1,变成了更具体的需求——比如Seedance的客户会说“我要4K版本”。另一类是复杂问题,特别针对非Digital Native的企业,如何通过AI最终产生业务价值,这还需要陪跑和建议。
模型边界还模糊,如何在迭代很快的同时做好企业端落地?落地有敏态和稳态两种方式:稳态是把工作流程抽象出来,通过AI改造;敏态是把好的工具给人,让大家广泛尝试,试出好的实践再用稳态落地。对敏态来说,陪跑是很重要的事。
MaaS市场要再往下一个阶段走,还差什么?答案很直接:模型,模型需要更好。另外,各个行业相关的Harness也要能做出来。
---
## 三、火山会成为一个纯MaaS公司吗?
听说一鸣在2024年问过谭待:既然卖API或者卖Token可以挣钱,为什么还要做云?实际上,这个问题不是一鸣问的,是别人问的。
谭待现在的回答很明确:MaaS就是云的一部分,不要把MaaS和云对立来看。他之前一直讲这个观点,但两年前MaaS规模还特别小,他说MaaS会是个大生意、毛利也不错,别人都不信,觉得是在亏钱卖。
什么时候大家开始信了?就是今年。老黄(黄仁勋)讲了Token经济学之后,大家都开始相信了。
火山今年的Token消耗一直在涨,客户越来越多。企业和个人用户数已经超过100万;“万亿俱乐部”(累计消耗过万亿Tokens的企业)现在有200家,去年12月才100家。而且客户留存很好,原来那100家基本没有流失。
今年MaaS的增长主要来自什么模型?目前Seedance还是大头,超过一半,但LLM也不少。长期来看LLM会是更大的市场——比如做一个视频创作的Agent,除了调Seedance,肯定也要调LLM。
火山未来会成为一个纯MaaS公司吗?谭待说,火山的目标一直没有变化,就是要做最好的AI云公司。他反复强调:不要把MaaS和云对立来看。以前云叫IaaS、PaaS、SaaS,以后的云就是AI云,是MaaS、Agent。AI云时代,IaaS还会在,只不过以后是Agent去调用这些IaaS组件了。
但从市场角度看,火山一直强调的是MaaS营收。为什么?谭待解释:对外讲MaaS的口径和市占率,是因为只有这个东西才是AI云真正的核心。如果AI云还要去卖IaaS,跟以前有什么区别?无非是把CPU变成GPU而已。
那传统云计算的存量市场,火山还要不要抓?“如果你回到2012年,字节成立那一年,你会去大做PC搜索吗?”谭待反问。AI驱动的云是比传统云大10倍的市场,以后更多的负载会跑到这上面。可能现在传统云是1000亿美金的市场规模,将来还是1000亿美金,但AI云可能是1万亿美金。
MaaS的壁垒来自哪里?如果MaaS就是跟着SOTA模型在走,粘性似乎比公有云还低。谭待认为,把模型做好确实重要,但这本身就意味着上牌桌的壁垒很高。把模型做好比把云做好更难:做云偏工程驱动,而做模型除了工程能力,还需要一群有天才想法的人。但他并不觉得MaaS比云粘性低,只是阶段问题。云最开始只卖主机也没有粘性,后来有了很多产品后才有粘性。
MaaS服务什么时候会变得有粘性?如果只是用来做Coding提效,没有跟生产系统深度结合,这种应用程度很浅,容易没有粘性。但一旦做成公司安全或其他核心生产系统的一部分,耦合性就大了。
MaaS市场刚兴起时,火山主要说的是Token消耗量,有些友商觉得这不够本质。谭待笑说:“他们现在都叫Token事业部了,不就认同这个观点了吗?”当下MaaS最重要的指标是什么?Token营收肯定是最重要的。
坊间传闻火山上半年不断调高MaaS营收目标,最新数字是150亿。谭待没有确认具体数据,只说“照这个增长趋势来看,年初目标肯定能完成,也确实提高了目标。”
火山目前的首要目标还是营收规模吗?谭待强调:“我们从成立第一天起,一直追求的就是有毛利的规模,没有毛利的规模我们是不要的。第一是要有毛利,第二是在这个基础上要有规模。”
大模型时代会比以前更早看到利润吗?比如智谱的GLM因为供不应求已经上调了三次价格。谭待的观点很简单:模型好,创造的价值高,就能赚更多钱。2024年模型降价是因为那时模型就只值那个钱;现在能力更强,能帮客户创造更大的价值,所以能定更高的价格。
怎么理解模型的定价逻辑?定价不是按毛利率来反推的,而是看Token到底能创造多少价值。定价要让客户的迁移收益高于迁移成本至少两三倍以上,大家才愿意用。比如以前拍一个广告1秒钟成本100块,现在用Seedance做只要几块钱,那肯定值得用。客户都很聪明,他知道模型创造的价值跟过去比是值这个定价的,本质还是模型价值提升了。
关于外传Seedance利润在70%左右的说法,谭待表示:“这个数据是外部传的,我们没怎么算过这块的毛利。”
---
## 四、AI带来的变化,比绝大多数人想象的都要巨大
2024年时,谭待说大模型还在“大哥大”时代。现在呢?“比大哥大好一点点,至少到功能机了吧。”
大哥大的年代,只有少数人能用。现在很多人已经用上了AI,但肯定还没到智能机时代。一个重要的变化是:模型进入了创作、Coding、Agent的商业生产级领域。一旦进去,就能走出商业闭环,能赚到钱,有钱就能做更好的模型,创造更大的价值——这个飞轮就转起来了。
海外市场在今年火山的优先级里有多高?谭待表示一直重视全球化——火山成立同年,同步成立了BytePlus来做非中市场。今年海外投入力度会多大提升?这不取决于决心,而取决于模型有没有竞争力。没有竞争力的时候,怎么投也没用。
有消息称Seedance的市占率已超过谷歌的Veo成为全球第一?谭待表示在国内是第一,海外发展也很快,海外市场在Seedance整体的占比已经快一半了,但不清楚全球市场的排名。
今年海外市场在业务优先级里有多高?很多中国创作领域工具公司都在出海,火山鼓励并陪伴他们一起出海。海外也有本地客户来用,比如WPP全球的Agency在很多地方都有合作。
MaaS市场已经到了白热化竞争的阶段吗?“很难估算。MaaS市场每年还是5到10倍的增长,我说的都是增量市场。”所以现在还是一起做大蛋糕的阶段,竞争只是局部竞争。
谭待今年的OKR有变化吗?没什么变化,战略很稳定:MaaS做第一,把AI云原生产品栈打磨好,把组织建设好。唯一的变化是——前年写的是“扩大云市场份额”,今年改成了“聚焦在AI云上”。
谭待自己这两年最大的变化是什么?英文变好了一点——因为要见很多海外客户。
对组织和管理有什么新思考?第一,最重要的还是把战略想清楚,不要老变,要看得更长久。火山在AI这件事上战略做得比较早,也比较坚定。第二,人才多样性很重要——比如Seedance现在得招些导演进团队,AI要渗透各行各业,不能纯靠IT背景的人。第三,要不断反省,人在看到一点成绩的时候很容易飘。
最近一次反思是什么?“不要做太多微观操作。”谭待发现前段时间自己的微观操作太多了——一般有自信的时候就容易这样。但现在事情细节太多,很多事情不够了解,少干涉一点会好一些,要信任团队。
火山成立时定下了2030年千亿营收目标,时间表会提前吗?2025年就已经把这个时间表提前了,今年还会再提一点。时间表不断提前,现在对AI市场的任何预估还是有效的吗?
“我们过去三年都是这样的:年初定一个很高的目标,团队都觉得太难了,然后年中发现快完成差不多了,就要往上调。”谭待总结道,“AI带来的变化,比绝大部分人想象的都要更大、更快。”