您的位置：首页 > > 教程攻略 > ai资讯 >专访火山引擎谭待：模型好对MaaS是最重要的事，豆包2.1算「上牌桌」了

专访火山引擎谭待：模型好对MaaS是最重要的事，豆包2.1算「上牌桌」了

来源:互联网 更新时间:2026-06-26 14:14

# 文 | 邓咏仪 # 编辑 | 张雨忻

火山引擎总裁谭待来源：火山引擎过去三年，火山引擎总裁谭待给团队定MaaS（模型即服务）营收目标的过程，几乎成了每年必演的“剧本”：年初扔下一个高得让人皱眉的数字，团队集体觉得“这不可能”；到了年中，进度条居然快拉满了，目标于是又被抬高一截。 2026年初，字节的视频模型Seedance 2.0给火山引擎打响了漂亮的开门红。作为云市场的后来者，这只“靠AI起跳”的队伍，交出了让行业侧目的成绩单。 “两年前我就和团队说MaaS是个大生意，当时没人信。”谭待说得云淡风轻，但数据不会骗人——从2025年下半年起，Coding和视频模型终于解锁了商业化生产场景。市场逐渐意识到：模型的能力边界远比想象中更宽，而顶尖模型，是目前MaaS服务最核心的增长引擎，甚至没有之一。 6月23日的火山引擎Force大会上，字节新一代旗舰模型豆包大模型2.1 Pro正式登场。这标志着字节在视频生成之外，模型侧终于把Coding这块拼图给补上了。谭待对这款新模型的定位很直白：在Coding和Agent能力上，“终于可以上桌了”。在知名编程评测Terminal Bench上，豆包大模型2.1 Pro的表现已能与Claude Opus 4.7基本持平，长程任务和复杂任务都达到了可用门槛。

来源：火山引擎这恰恰是火山最在意的战场。Coding/Agent能力的进步，意味着模型能真正进入企业和个人的核心生产环节——换句话说，也就是能创造更多商业价值。除了旗舰模型，火山还带来了一系列更新：Seedance 2.0 4K版、图像生成模型Seedream 5.0、豆包语音生成模型1.0，以及即将在7月发布的Seedance 2.5。 “视频生成模型其实是世界模型的其中一种实现方案，而且从目前来看，是一种比较成熟、可以通过无监督方式进行大规模扩展的技术路径。”谭待解释，Seedance模型对物理世界有精准的还原与理解，这让高质量的视觉数据合成变得可行，也为具身智能、无人驾驶等领域的研究提供了新工具。回想2024年访谈谭待时，他把大模型比作“大哥大”时代——笨重、昂贵、只有少数人用得起。两年后的今天，已经快进到了“功能机”：大模型不再是少数人的玩物，而是真实地进入了更多人的生活和工作中。目前，火山在MaaS市场上已经做到了行业领先。最新数据显示，相比2025年底，火山的日均Token消耗量又提升了50%，达到180万亿，较两年前增长超过1500倍；“万亿俱乐部”（累计Token消耗达万亿量级）的客户数也翻了一倍，超过200家。

来源：火山引擎随着这次发布的模型，以及年内可能推出的新模型，火山的营收目标已经再次上调。这背后是模型定价逻辑的变化。2024年，火山曾是最早把大模型降到“地板价”的厂商，但这一次大会上，这个话题再没被提起。 “2024年之所以降价，是因为那时所有模型能做的就只有Chatbot，模型就值那个价。”谭待说。但如今，模型已经能够进入核心生产环节。这也提出了一个更大的问题：当大模型真正进入更多行业的核心生产环节，AI究竟会给云行业带来什么改变？ 2024年底，有人曾问谭待：如果卖API就能挣钱，为什么还要做云？后者曾被视作长坡厚雪的好生意，但经过十多年发展，在国内也卷成了红海。在谭待看来，这个问题本身就不成立。MaaS和云从来不是对立关系——未来的云，很可能是用Agent去调度IaaS、PaaS、SaaS。传统云不会消失，而是会变成AI云的一部分。“基于模型和Agent构建的新负载，可能是传统云的10倍、20倍。” 谭待也反驳了“MaaS服务没有忠诚度”的观点。“云计算早期卖主机的时候也没有粘性，”他说，“现在大家用AI用得还比较浅，一旦模型真正进入一家企业的核心生产系统，耦合性就大了。” 显然，无论火山还是其他云厂商，都把AI视作最重要的、甚至唯一的增长引擎。谭待觉得这是理所当然的：“如果回到2012年字节成立那一年，你会在大做PC搜索吗？” 那么，火山接下来要解决的核心问题就是：如何在这个MaaS市场中持续赢下去？谭待还没有完整的答案，但有一件事是确定的，也是最难的：让模型长期保持领先。 --- ## 一、模型终于真正进入了核心生产环节过去一年，火山引擎的增长速度令人瞩目。核心驱动力来自哪里？从数据来看，答案很清晰：模型解锁了真正的生产级场景，进入了核心生产环节。越是有挑战、有价值的生产力场景，解锁后带来的价值就越大。一条主线是视频生成。Seedance是全球第一个真正解锁了商业化生产场景的视频模型。另外一条主线是LLM/Agent——这个生产级解锁，发生在去年Claude Opus 4.6之后。有个细节很能说明问题：根据Cursor的分析，在Claude Opus 4.6出来之前，点Tab补全代码的比例高于Agent自动完成；但之后，两种模式的比例发生了逆转。这证明4.6之后，模型能力有了质的飞跃，能真正用于生产级的Coding和Agent场景。如何判断Seedance 2.0确实达到了商业化生产的水准？从用户用量就能看出端倪：之前，大多数视频模型只能生产娱乐性的UGC或PGC内容，很难用到严肃创作场景，比如电影、电视剧、广告。而Seedance 2.0发布后，用户行为发生了明显变化：以前视频生成模型的用量在周末大于工作日，和娱乐类C端产品没什么区别；但Seedance 2.0之后，工作日负载反而比周末大两倍以上——这证明大家真的在用它在工作。视频生成也是通往世界模型的路径之一，在实体产业中潜力巨大。Seedance已经在具身智能、工业制造、智能驾驶等领域落地，为数据合成、场景仿真、流程演示等业务需求提供了新工具。那么，Seedance 2.0出来前，内部有没有预料到它会这么成功？“也不算大爆吧，”谭待说，“我们本来的目标定得比现在更激进，现在完成起来还是有点挑战的。” 为什么Seedance 2.0能做到这么好？关键在于综合能力。做好视频生成，需要有好的语言模型作为基础，同时图片生成和VLM（视频理解模型）的能力也要够强。Seedance 2.0依托了豆包本身的能力，这是相比单纯做视频模型的垂直公司的重要优势。还有一个因素：中国的内容创作领域在全球范围内都极其活跃，这种土壤让中国最早做出了顶尖的视频模型。不过，科技圈似乎已经有了“视频生成战争已告一段落，字节占据统治地位”的论调。谭待并不认同：“还没到那个阶段。整个AI在视频生成上的渗透率其实还非常低。”他认为外界过于关注Seedance的短期收入，忽视了它的技术价值。视频生成是一种能够通过无监督方式大规模扩展的技术方案，在实体产业中应用潜力巨大。AI真正创造价值，不是替代过去，而是让整个行业变得更大。这次Force大会发布的豆包大模型2.1 Pro，被定义为什么水平？谭待说，它已经达到可用标准，可以对标Claude Opus 4.6，进入了Agent的可用门槛。更重要的是，它标志着字节在Coding领域真正上牌桌了——“国内真上牌桌的还没有几个。” “可用”的标准是什么？谭待列出了几个关键点：第一，Coding能力强。在数字世界里，Coding能力强意味着能灵活调用脚本、调用工具，泛化能力强。第二，能完成复杂的通用Agent任务。这需要更好地调用工具、具备长程任务能力、与记忆相结合、适配各种Harness和框架，还要有很好的VLM能力——很多输入需要通过视觉处理，比如Computer Use。第三，具备可规模化应用的能力。模型再好，如果价格太贵、延迟太高、吞吐量不足，都不行。豆包大模型2.1在这些方面都做得不错。Coding能力已经能超过Claude Opus 4.6。规模化应用方面，豆包App刚上线的任务模式就是用豆包大模型2.1来做的。那么，中国模型在Coding场景什么时候才算真正追上来了？谭待预测：“大概会在今年Q2的时候。”虽然很多模型都说要“比肩”谁谁谁，但光说没用。如果真追上了甚至超越了，大家会为你付费——看ARR就知道有没有做到。为什么国内在Coding场景上整体速度比视频慢？原因有二：一是全球范围内LLM的竞争更激烈；二是起步晚，Anthropic和OpenAI起步早得多，Coding方向也是他们最早定义和发力的。起步晚，现在进度落后很正常，这本来就是一件很难的事。原来Seed还有单独的Coding模型SeedCode，现在还会做吗？豆包大模型2.1发布后就没有了——Coding和Agent能力都整合到主版本里去了。模型迭代太快了，不想等一两个月才发一次版，所以推出了新的系列叫Seed Evolving，在豆包大模型2.1的基础上每一两周更新一次。这个系列是主要面向开发者的吗？不只是开发者。有的企业追求模型稳定，直接用豆包大模型2.1就行。但还有很多人希望始终用到最新最智能的版本，Seed Evolving就是满足他们的——但它不是小白鼠版本，会有严格的评估。现在两条生产级场景的主线都解锁了，LLM和视频生成哪个更重要？站在谭待的角度，LLM更重要一些，它能创造的价值空间更大。“虽然目前Seedance卖得多一点，但我希望后面LLM能成为大头。” --- ## 二、要让模型充分释放能力，还需要一个“中间层” 一个市场共识是：现在是模型牵引产品增长的年代。模型足够SOTA就能卖得好，那火山的价值怎么体现？谭待认为，能做的其实有很多——“模型能力越强，责任越大。” 比如春节前Seedance 2.0火了，但火山的API到4月份才推出，晚了将近两个月。这段时间主要在做什么？版权保护。模型推理要做好，Guardrail（模型护栏）也很重要。从LLM来看，模型能力其实是通过Harness才充分释放出来的。现在Seedance还缺少一层属于它的Harness。火山最近在思考：应该怎样和行业结合，把不同模型的这层Harness做起来？现在有FDE（前沿部署工程师）团队在各个行业里做这件事。各行各业需要什么样的Harness？在影视创作领域，很多数字资产没有被管理起来，很多技能也没有积累下来，这些都限制了模型的发挥。未来在视频创作领域，也会有类似Claude Code的东西出现。视频领域的Harness必须字节自己做吗？谭待说，会和大家一起合作，关键是要找到懂这个事情的人。Coding领域因为程序员很懂，所以能做出对应的Harness；视频创作领域也一样，得懂创作流程。最近火山就在努力给团队招导演。这次Seedance新上线的“3D白模预演”功能，就来自一位业内知名导演（也是火山引擎客户）的建议。科幻电影里有个重要制作环节叫“白模”，用来表达场景、人物关系和剧情推进。把白模作为参考直接让模型生成对应镜头——这是全球第一个在视频模型上实现这个功能的。那么视频模型的能力是不是还没有被充分释放出来？不能这么说。视频模型在国内落地速度很快，因为有一个不错的中间层——中国的视频创作领域一直很活跃，创作者能敏感地知道如何利用这些新技术，把API变成内容，最终实现商业落地。当然，火山在这个过程中还有优化空间。 LLM的落地难也是因为没有中间层吗？如果SaaS生态足够好，是可以做一个桥梁的。但国内SaaS基础比较薄弱，终端企业直接使用API有难度。反过来说，这也意味着有弯道超车的机会。企业客户现在最关心的是“模型怎么落地”的问题吗？大家都相信AI，但AI在企业里到底怎么落地，确实很多人还不清楚。有一类场景已经走通了从0到1，变成了更具体的需求——比如Seedance的客户会说“我要4K版本”。另一类是复杂问题，特别针对非Digital Native的企业，如何通过AI最终产生业务价值，这还需要陪跑和建议。模型边界还模糊，如何在迭代很快的同时做好企业端落地？落地有敏态和稳态两种方式：稳态是把工作流程抽象出来，通过AI改造；敏态是把好的工具给人，让大家广泛尝试，试出好的实践再用稳态落地。对敏态来说，陪跑是很重要的事。 MaaS市场要再往下一个阶段走，还差什么？答案很直接：模型，模型需要更好。另外，各个行业相关的Harness也要能做出来。 --- ## 三、火山会成为一个纯MaaS公司吗？听说一鸣在2024年问过谭待：既然卖API或者卖Token可以挣钱，为什么还要做云？实际上，这个问题不是一鸣问的，是别人问的。谭待现在的回答很明确：MaaS就是云的一部分，不要把MaaS和云对立来看。他之前一直讲这个观点，但两年前MaaS规模还特别小，他说MaaS会是个大生意、毛利也不错，别人都不信，觉得是在亏钱卖。什么时候大家开始信了？就是今年。老黄（黄仁勋）讲了Token经济学之后，大家都开始相信了。火山今年的Token消耗一直在涨，客户越来越多。企业和个人用户数已经超过100万；“万亿俱乐部”（累计消耗过万亿Tokens的企业）现在有200家，去年12月才100家。而且客户留存很好，原来那100家基本没有流失。今年MaaS的增长主要来自什么模型？目前Seedance还是大头，超过一半，但LLM也不少。长期来看LLM会是更大的市场——比如做一个视频创作的Agent，除了调Seedance，肯定也要调LLM。火山未来会成为一个纯MaaS公司吗？谭待说，火山的目标一直没有变化，就是要做最好的AI云公司。他反复强调：不要把MaaS和云对立来看。以前云叫IaaS、PaaS、SaaS，以后的云就是AI云，是MaaS、Agent。AI云时代，IaaS还会在，只不过以后是Agent去调用这些IaaS组件了。但从市场角度看，火山一直强调的是MaaS营收。为什么？谭待解释：对外讲MaaS的口径和市占率，是因为只有这个东西才是AI云真正的核心。如果AI云还要去卖IaaS，跟以前有什么区别？无非是把CPU变成GPU而已。那传统云计算的存量市场，火山还要不要抓？“如果你回到2012年，字节成立那一年，你会去大做PC搜索吗？”谭待反问。AI驱动的云是比传统云大10倍的市场，以后更多的负载会跑到这上面。可能现在传统云是1000亿美金的市场规模，将来还是1000亿美金，但AI云可能是1万亿美金。 MaaS的壁垒来自哪里？如果MaaS就是跟着SOTA模型在走，粘性似乎比公有云还低。谭待认为，把模型做好确实重要，但这本身就意味着上牌桌的壁垒很高。把模型做好比把云做好更难：做云偏工程驱动，而做模型除了工程能力，还需要一群有天才想法的人。但他并不觉得MaaS比云粘性低，只是阶段问题。云最开始只卖主机也没有粘性，后来有了很多产品后才有粘性。 MaaS服务什么时候会变得有粘性？如果只是用来做Coding提效，没有跟生产系统深度结合，这种应用程度很浅，容易没有粘性。但一旦做成公司安全或其他核心生产系统的一部分，耦合性就大了。 MaaS市场刚兴起时，火山主要说的是Token消耗量，有些友商觉得这不够本质。谭待笑说：“他们现在都叫Token事业部了，不就认同这个观点了吗？”当下MaaS最重要的指标是什么？Token营收肯定是最重要的。坊间传闻火山上半年不断调高MaaS营收目标，最新数字是150亿。谭待没有确认具体数据，只说“照这个增长趋势来看，年初目标肯定能完成，也确实提高了目标。” 火山目前的首要目标还是营收规模吗？谭待强调：“我们从成立第一天起，一直追求的就是有毛利的规模，没有毛利的规模我们是不要的。第一是要有毛利，第二是在这个基础上要有规模。” 大模型时代会比以前更早看到利润吗？比如智谱的GLM因为供不应求已经上调了三次价格。谭待的观点很简单：模型好，创造的价值高，就能赚更多钱。2024年模型降价是因为那时模型就只值那个钱；现在能力更强，能帮客户创造更大的价值，所以能定更高的价格。怎么理解模型的定价逻辑？定价不是按毛利率来反推的，而是看Token到底能创造多少价值。定价要让客户的迁移收益高于迁移成本至少两三倍以上，大家才愿意用。比如以前拍一个广告1秒钟成本100块，现在用Seedance做只要几块钱，那肯定值得用。客户都很聪明，他知道模型创造的价值跟过去比是值这个定价的，本质还是模型价值提升了。关于外传Seedance利润在70%左右的说法，谭待表示：“这个数据是外部传的，我们没怎么算过这块的毛利。” --- ## 四、AI带来的变化，比绝大多数人想象的都要巨大 2024年时，谭待说大模型还在“大哥大”时代。现在呢？“比大哥大好一点点，至少到功能机了吧。” 大哥大的年代，只有少数人能用。现在很多人已经用上了AI，但肯定还没到智能机时代。一个重要的变化是：模型进入了创作、Coding、Agent的商业生产级领域。一旦进去，就能走出商业闭环，能赚到钱，有钱就能做更好的模型，创造更大的价值——这个飞轮就转起来了。海外市场在今年火山的优先级里有多高？谭待表示一直重视全球化——火山成立同年，同步成立了BytePlus来做非中市场。今年海外投入力度会多大提升？这不取决于决心，而取决于模型有没有竞争力。没有竞争力的时候，怎么投也没用。有消息称Seedance的市占率已超过谷歌的Veo成为全球第一？谭待表示在国内是第一，海外发展也很快，海外市场在Seedance整体的占比已经快一半了，但不清楚全球市场的排名。今年海外市场在业务优先级里有多高？很多中国创作领域工具公司都在出海，火山鼓励并陪伴他们一起出海。海外也有本地客户来用，比如WPP全球的Agency在很多地方都有合作。 MaaS市场已经到了白热化竞争的阶段吗？“很难估算。MaaS市场每年还是5到10倍的增长，我说的都是增量市场。”所以现在还是一起做大蛋糕的阶段，竞争只是局部竞争。谭待今年的OKR有变化吗？没什么变化，战略很稳定：MaaS做第一，把AI云原生产品栈打磨好，把组织建设好。唯一的变化是——前年写的是“扩大云市场份额”，今年改成了“聚焦在AI云上”。谭待自己这两年最大的变化是什么？英文变好了一点——因为要见很多海外客户。对组织和管理有什么新思考？第一，最重要的还是把战略想清楚，不要老变，要看得更长久。火山在AI这件事上战略做得比较早，也比较坚定。第二，人才多样性很重要——比如Seedance现在得招些导演进团队，AI要渗透各行各业，不能纯靠IT背景的人。第三，要不断反省，人在看到一点成绩的时候很容易飘。最近一次反思是什么？“不要做太多微观操作。”谭待发现前段时间自己的微观操作太多了——一般有自信的时候就容易这样。但现在事情细节太多，很多事情不够了解，少干涉一点会好一些，要信任团队。火山成立时定下了2030年千亿营收目标，时间表会提前吗？2025年就已经把这个时间表提前了，今年还会再提一点。时间表不断提前，现在对AI市场的任何预估还是有效的吗？ “我们过去三年都是这样的：年初定一个很高的目标，团队都觉得太难了，然后年中发现快完成差不多了，就要往上调。”谭待总结道，“AI带来的变化，比绝大部分人想象的都要更大、更快。”

专访火山引擎谭待：模型好对MaaS是最重要的事，豆包2.1算「上牌桌」了

热门资讯

热门手游

相关攻略

热门专题