



2026年初,字节的视频模型Seedance 2.0让火山引擎迎来了一场漂亮的开门红。作为云市场的后来者,火山引擎乘着AI的风,实现了让行业意想不到的增长。
“两年前我就和大家说MaaS是个大生意,当时你们都不信。”谭待对智能涌现说。
从2025年下半年开始,Coding和视频模型陆续解锁了商业化生产的场景,这让大家发现,现阶段,模型的能力边界依旧难以预测,顶尖模型是MaaS服务当下颇为核心的增长引擎。
在6月23日的火山引擎Force大会上,字节新一代旗舰模型豆包大模型2.1 Pro登场。这也代表着字节在视频生成之外,模型侧终于补上了Coding的拼图。
谭待对豆包大模型2.1 Pro的定义是,在Coding和Agent能力方面,“终于可以上桌了”。在知名编程评测Terminal Bench上,豆包大模型2.1 Pro已经能与Claude Opus 4.7基本持平,在长程任务,复杂任务上都表现优秀,达到可用门槛。
这是火山更在意的市场。Coding/Agent能力的进步,意味着模型能进入更多企业、个人的核心生产环节。换句话说,也能创造更多商业价值。
除了旗舰模型,火山还带来了一系列模型更新,包括Seedance 2.0 4K版、图像生成模型Seedream 5.0 Pro,豆包语音生成模型1.0,以及即将在7月发布的Seedance 2.5。
“视频生成模型其实是世界模型的其中一种实现方案,并且目前来看,是一种比较成熟的,可以通过无监督的方式进行大规模扩展的技术方案。”谭待提到,Seedance模型,因为表现出对物理世界精准的还原与理解,这也使得高质量的视觉数据合成更可行,加速了具身智能、无人驾驶等等领域的研究进展。
2024年,我们访谈谭待时,他认为大模型才刚到“大哥大”时代;两年后的今天,已经快进到了功能机——大模型不再是少数人的玩具,而是真实地进入到了更多人的生活和工作中。
目前,火山在MaaS市场已经做到行业头部水平。最新的数据是,相较2025年底,火山的日均Token消耗量又提升了50%,达到180万亿,相比两年前增长超过1500倍;“万亿俱乐部”(累计Token消耗达到万亿量级)的客户数也实现翻倍,超过200家。
谭待说,随着这次发布的模型,以及今年还有可能发布的模型,火山今年的营收目标已经上调。
这背后是模型的定价逻辑有所变化。2024年,火山曾经是最早让大模型降到“地板价”的厂商,但这次大会上,他们不再谈及这点。
“2024年之所以降价,是因为所有模型能做的就是Chatbot,模型就值那个价。”他对智能涌现表示。但如今,模型已经能够进入到核心生产环节。
这也引出了一个更大的问题:当大模型真正进入到更多行业的核心生产环节,AI究竟会给云行业带来什么变化?
2024年底,有人曾经问谭待:如果卖API就能挣钱,为什么还要做云?后者曾经被认为是长坡厚雪的好生意,但经过十多年发展,在国内也已经卷成红海。
在谭待看来,这个问题本身就不成立。MaaS和云从来不是对立关系——未来的云,更可能是用Agent去调度IaaS、PaaS、SaaS,传统云不会消失,而是会变成AI云的一部分。“基于模型和Agent构建的新负载,可能是传统云的10倍、20倍大。”
谭待也反驳了“MaaS服务没有忠诚度”的观点。“云计算早期卖主机的时候也没有粘性,”他说,“现在大家对AI用得还比较浅,等模型真正进入一家企业的核心生产系统,耦合性就大了。”
很显然,当下无论是火山还是其他云厂商,都把AI当作最重要的、甚至唯一的增长引擎。谭待觉得这是理所当然的:“如果回到2012年字节成立那一年,你会在那个时间点大做PC搜索吗?”
而接下来留给火山的问题则是:要如何在MaaS市场中一直赢下去?
谭待对此还没有一个完整的答案,但有一件事是确认的,也是难度最大的,那就是:要让模型长期保持领先。
模型终于真正进入了核心生产环节
智能涌现:过去一年,火山增长得很快,核心驱动力来自哪里?
谭待:本质是因为模型解锁了真正的生产级场景,进入了核心生产环节。越是有挑战、有价值的生产力场景或环节,解锁之后带来的价值就越大。
一条主线是视频生成,Seedance是全球第一个真正解锁了商业化生产场景的模型。
另外一条主线是LLM/Agent,生产级的解锁是去年Claude Opus 4.6出来之后做到的。Cursor有个分析:Agent自动完成代码和点Tab补全代码这两种模式的比例,在Claude Opus 4.6出来之前,点Tab补全的比例是更高的,但在那之后,就发生了逆转。说明4.6之后,模型的能力有了很大提升,能真正用在生产级的Coding和Agent场景上了。
智能涌现:怎么判断Seedance 2.0真的做到了商业化生产?
谭待:Seedance 2.0出来之前,大多数视频模型都是用来生产些UGC、PGC的娱乐视频,比较难应用到严肃创作场景,比如电影、电视剧、广告。
我们从用户的用量情况里也可以看到这个变化:以前,视频生成模型的用量是周末大于工作日的,跟很多娱乐类的C端产品一样。但Seedance 2.0出来之后就不是这样了,它的工作日负载会比周末大两倍以上,说明大家真的是用它在工作。
视频生成也是通往世界模型的路径之一,在实体产业中有很大的应用潜力。Seedance已在具身智能、工业制造、智能驾驶等领域落地,为数据合成、场景仿真、流程演示等业务需求提供新的工具能力。
智能涌现:Seedance 2.0出来前,你们内部预料到了会大爆吗?
谭待:也不算大爆吧。我们本来还定了一个更激进的目标呢,但现在看起来完成还是有挑战的。
智能涌现:Seedance 2.0为什么能做到这么好的效果?
谭待:它是我们综合能力的体现。你要把视频生成做好,需要有比较好的语言模型作为基础,并且图片生成、以及VLM(视频理解模型)的能力也要够强。
Seedance 2.0做得好,可以认为它依托了豆包本身的能力。这是我们相比单纯做视频模型的垂直公司的一个重要优势。
还有一个点是,中国的内容创作领域在全球来看都是很活跃的。中国最早做出最好的视频模型,跟这有关系。
智能涌现:一些市场声音觉得视频生成领域的战争已经告一段落了,字节占据了统治级地位,你怎么看?
谭待:还没到那个阶段。整个AI在视频生成上的渗透率其实还非常低。
现在外界过多关注了Seedance的短期收入,忽视了Seedance的技术价值。视频生成是一种比较成熟的,可以通过无监督的方式进行大规模扩展的技术方案。Seedance模型表现出对物理世界精准的还原与理解,这也使得高质量的视觉数据合成更可行,加速了具身智能、无人驾驶等等领域的研究进展,在实体产业中会有非常大的应用潜力。
而且AI如果真的创造价值,不是要替代过去,而是让这个行业整体变得更大。
智能涌现:这次Force大会,你们也发了新的旗舰模型豆包大模型2.1,你们怎么定义这个模型?
谭待:我觉得豆包大模型2.1 Pro已经达到了可用的标准,可以对标Claude Opus 4.6的水平,进入到了Agent的可用门槛。
豆包大模型2.1也标志着我们在Coding领域真正上牌桌了。这是很重要的事,国内真上牌桌的还没有几个。
智能涌现:你们对“可用”的定义是?
谭待:有几个特点:
第一,Coding能力很强。在数字世界里Coding能力强意味着你能灵活地调用脚本、调用工具,泛化能力也很强。
第二,能完成复杂的通用Agent任务。这意味着要能更好地调用工具,有长程任务的能力,跟记忆有好的结合,能适配各种Harness和框架,还要有很好的VLM能力——很多输入是要通过视觉处理的,比如Computer Use。
第三,具备可规模化应用的能力。如果模型很好但价格太贵,是不行的;延迟太高,比如Throughput(吞吐量)20多毫秒也不行;模型还要能大规模支持更多服务。
豆包大模型2.1在这些方面都做得非常不错。Coding能力跟Claude Opus 4.6比的话,也能超过。规模化应用方面,豆包App刚上的任务模式,就是用豆包大模型2.1来做的。
智能涌现:在Coding场景,你觉得中国的模型什么时候才算是真正追赶上来了?
谭待:大概会在今年Q2的时候。虽然很多模型以前都说我要比肩谁谁谁,但光说是没用的。你如果真的追上了、甚至超越了,大家会为你付费。看ARR就能知道你到底有没有做到。
智能涌现:和视频相比,为什么国内在Coding场景上速度整体要慢一些?
谭待:首先,全球范围来看LLM的竞争都是更激烈的。第二,我们起步还是晚的,Anthropic和OpenAI起步早非常多,Coding这个方向也是他们最早定义并且发力的。我们起步晚,现在整体进度比人家晚也正常,它本来就是很难的一件事。
智能涌现:原来Seed还有单独的Coding模型SeedCode,现在还会做吗?
谭待:豆包大模型2.1发布后就没有了,Coding和Agent能力都合到主版里面去了。
模型现在迭代太快了,我们不想等一两个月才发一次版,所以现在出了一个新的系列叫Seed Evolving,它在豆包大模型2.1的基础上,每一两周就会更新一次。
智能涌现:这是主要面向开发者群体的模型吗,围绕Coding和Agent方向做优化?
谭待:不只是开发者。有的企业追求模型的稳定表现,不要有惊吓也不需要惊喜,那他们直接用豆包大模型2.1就行。但还有很多人就希望始终能用到最新最智能的版本,Seed Evolving就是来满足他们的。但它不是小白鼠版本,会有很严格的评估。
智能涌现:你们现在两条生产级场景的主线都解锁了,那LLM和视频生成,你觉得目前哪个更重要?
谭待:站在我的角度,LLM其实更重要一些,它能创造的价值空间更大。虽然我们的现状是Seedance卖的多一点,但我希望后面LLM能成为大头。
要让模型充分释放能力
还需要一个“中间层”
智能涌现:一个市场共识是,现在是模型牵引产品增长的年代,大家会觉得模型足够SOTA就能卖的好,那火山的价值怎么体现呢?
谭待:我们能做的其实有很多。模型能力越强,责任越大。
比如,春节前Seedance 2.0就火了,但火山的API推出至少晚了两个月,到4月份才推出。我们在干啥呢?主要就是在做版权保护的事。因为我们觉得,模型推理要做好,Guardrail(模型护栏)也很重要。
我们看LLM,它的模型能力其实是通过Harness才充分释放出来的。现在Seedance其实还缺少一层属于它的Harness。我们最近就在思考,应该怎么和行业结合,把不同模型的这层Harness做起来?我们现在就有FDE(前沿部署工程师)的团队在跟各个行业一起做这个事情。
智能涌现:展开讲讲,各行各业需要有什么样的Harness?
谭待:比如在影视创作领域里,有很多数字资产没有被管理起来,很多技能也没有积累起来,这些都限制了模型的发挥。我们觉得未来在视频创作领域,也会有像Claude Code这样的东西出来。
智能涌现:视频领域的Harness,必须字节自己做吗?
谭待:我们会跟大家一起合作,重要的是要找到懂这个事情的人。
Coding,因为程序员很懂,所以能做出对应的Harness。那么视频创作领域,你也得懂创作流程,所以我们最近也在努力给团队招导演。
比如说,这次Seedance新上线的功能“3D白模预演”,就是来自一位业内知名导演,也是火山引擎客户的建议。科幻电影里有很重要的一个制作环节叫“白模”,可以来表达场景、人物关系,剧情怎么推演,把白模作为参考,直接让模型生成对应镜头,我们也是全球第一个在视频模型上线这个功能的。
智能涌现:那你觉得现在视频模型的能力还没有被充分释放出来吗?
谭待:不能这么说。视频模型在国内的落地速度是快的,因为有一个很不错的中间层——中国的视频创作领域一直很活跃,所以创作者能很敏感地知道怎么用这些新技术,作为中间层把API变成内容,最终商业落地。当然,火山在这个过程里也还有优化的空间。
智能涌现:LLM(大语言模型)的落地也是难在没有中间层吗?
谭待:如果SaaS生态足够好的话,是可以做一个桥梁的。国内SaaS基础是比较薄弱的,终端的企业直接用上API有点难。当然反过来想,也意味着有弯道超车的机会。
智能涌现:企业客户现在最关心的是“模型怎么落地”的问题吗?
谭待:大家都相信AI,但AI在我这个企业怎么落地,确实大家还不是特别清楚。
有一类场景已经走通了从0到1,变成更具体的需求问题了,比如Seedance的客户会跟我们说,我要4K版本。
还有一类是复杂问题,特别是针对非Digital Native的企业,它要怎么通过AI最终产生业务价值,这还需要我们陪跑,给建议。
智能涌现:现在模型的边界还很模糊,怎么能够在模型迭代很快的时候,又做好企业端的落地?
谭待:落地有敏态和稳态两种方式。稳态是把工作流程抽象出来,通过AI改造;敏态是把好的工具给人,让大家广泛尝试,试出好的实践再用稳态落地。对于敏态来说,陪跑是很重要的事情。
智能涌现:你觉得MaaS市场要再往下一个阶段走,还差什么?
谭待:还是模型,模型需要更好。另外各个行业相关的Harness要能做出来。
火山会成为一个纯MaaS公司吗?
智能涌现:听说一鸣在2024年问过你,既然卖API或者卖Token可以挣钱,为什么还要做云?
谭待:不是他问的,是别人问的。
智能涌现:那你现在会怎么回答这个问题?
谭待:我一直讲的一个观点是,MaaS就是云的一部分,不要把MaaS和云对立起来看。
两年前MaaS规模还特别小,我当时老说MaaS会是个很大的生意,毛利也不错,但别人都不信,都觉得我们在亏钱卖。
智能涌现:什么时候大家开始信了?
谭待:就是今年。今年老黄(黄仁勋)讲了Token经济学,大家都开始相信这件事情了。
智能涌现:听说火山今年的Token消耗一直在涨,最近的情况是怎么样的?
谭待:客户肯定是越来越多的,我们企业和个人用户数已经100多万了。“万亿俱乐部”(累计消耗过万亿Tokens的企业)现在已经200家了,去年12月是100家。而且我们的客户留存很好,原来那100家基本没有流失的。
智能涌现:今年MaaS的增长,主要来自什么模型?
谭待:现在Seedance肯定还是大头,超过一半,但LLM这块也不少。
长期来看LLM会是更大的市场。比如你做一个视频创作的Agent,除了调Seedance,肯定也要调LLM。
智能涌现:一些火山同学想问你,未来火山会成为一个纯MaaS公司吗?
谭待:火山的目标一直没有变化,就是要做最好的AI云公司。但我一直强调的观点是,不要把MaaS和云对立来看。
以前云叫IaaS、PaaS、SaaS,以后的云就是AI云,就是MaaS、Agent。AI云时代,IaaS还会在,只不过以后是Agent去调用这些IaaS组件了。
智能涌现:但是从市场的角度看,火山一直强调的是MaaS营收。
谭待:我们一直对外讲MaaS的口径、市占率,是因为只有这个东西才是AI云真正的核心。如果AI云还要去卖IaaS,跟以前有什么区别?无非是把CPU变成GPU而已。
智能涌现:那传统云计算的存量市场,火山还要不要抓?
谭待:如果你回到2012年,字节成立那一年,你会去大做PC搜索吗?
AI驱动的云是比传统云大10倍的市场,以后更多的负载会跑到这上面。可能现在传统云是1000亿美金的市场规模,将来也还是1000亿美金,但AI云可能是1万亿美金。
智能涌现:你认为MaaS的壁垒来自哪里?如果说MaaS就是跟着SOTA模型在走,那粘性似乎比公有云还低。
谭待:把模型做好确实很重要,但这也意味着上牌桌的壁垒本身就很高。把模型这个事做好的挑战,比把云做好更大。做云是更偏工程驱动的事,做模型除了有工程能力,还需要一群有天才想法的人。
但我并不觉得MaaS比云粘性更低,它只是阶段的问题。云最开始只卖主机也没有粘性,后来有了很多产品后才有粘性。
智能涌现:什么时候MaaS服务会变得有粘性?
谭待:如果只是用来做Coding提效,没有跟生产系统深度结合,这种应用程度是很浅的,容易没有粘性。但如果把它做成公司安全或其他核心生产系统的一部分,耦合性就大了。
智能涌现:MaaS市场刚兴起的时候,你们主要说的是Token消耗量。一些友商觉得这不够本质,你怎么看?
谭待:他们现在都叫Token事业部了,不就认同这个观点了吗?
智能涌现:当下,你觉得MaaS什么指标最重要?
谭待:Token营收肯定是最重要的事。
智能涌现:我们听说火山上半年不断在调高MaaS营收目标,最新的数字是150亿,实际上呢?
谭待:具体数据就不说了。照这个增长趋势来看,我们年初的目标肯定是能完成的,也确实提高了目标。
智能涌现:火山目前的首要目标还是营收规模吗?
谭待:我们从成立第一天起,一直追求的就是有毛利的规模,没有毛利的规模我们是不要的。第一是要有毛利,二是在这个基础上要有规模。
智能涌现:大模型时代,我们会更早看到利润吗?智谱的GLM因为供不应求,已经往上调了三次价格。
谭待:你的模型好,创造的价值高,就能赚更多钱。
2024年做模型降价,是因为那时模型就只值那个钱。现在能力更强,能帮客户创造更大的价值,所以能定更高的价格。
智能涌现:怎么理解模型的定价逻辑?
谭待:定价不是按毛利率多少来反推的,而是看Token到底能创造多少价值。你的定价要让客户的迁移收益高于迁移成本至少两三倍以上,大家才有意愿来用。比如,以前拍一个广告1秒钟成本100块,现在用Seedance做只要几块钱,那肯定值得用。客户都很聪明的,他知道模型创造的价值跟过去比是值这个定价的,本质还是模型价值提升了。
智能涌现:据说Seedance的利润在70%左右?
谭待:这个数据是外部传的,我们没怎么算过这块的毛利。
AI带来的变化
比绝大多数人想象的都要巨大
智能涌现:2024年的时候,你说大模型还在“大哥大”时代,现在呢?
谭待:比大哥大好一点点,至少到功能机了吧。
大哥大的年代,只有少数人能用,现在已经很多人把AI用起来了,但肯定还没有完全到智能机时代。
一个很重要的变化是,模型进入到了创作、Coding、Agent的商业生产级领域。一旦进去之后,它就可以走出商业闭环,可以赚到钱,有钱就可以做更好的模型,创造更大的价值,这个飞轮就转起来了。
智能涌现:海外市场在火山今年的优先级里面有多高?
谭待:我们一直都很重视全球化,火山成立的同年,我们也同步成立了BytePlus,来做非中市场(中国以外的市场)。
智能涌现:今年,海外市场投入力度会有多大提升?
谭待:我觉得这不取决于我们,而是取决于你模型有没有竞争力。没有竞争力的时候,你怎么投入也没用嘛。
智能涌现:我们听说,Seedance的市占率已经超过了谷歌的Veo,成为全球第一了?这显然已经有竞争力了。
谭待:在国内是第一,在海外发展也很快,海外市场在Seedance整体的占比已经快一半了。但不清楚全球市场的排名。
智能涌现:今年,海外市场在你们的业务优先级里会有多高?
谭待:很多中国的创作领域工具公司都在出海,我们也鼓励和陪伴他们一起出海。海外也会有本地客户来用我们,比如WPP全球的Agency,在很多地方跟我们都有合作。
智能涌现:现在MaaS市场已经到了白热化竞争的阶段?
谭待:很难估算。MaaS市场每年还是5到10倍的增长,我说的都是增量市场。
智能涌现:还是一起做大蛋糕的阶段。
谭待:对,现在的竞争都是一些局部竞争。
智能涌现:你今年的OKR是什么?有变化吗?
谭待:没什么变化,我们战略很稳定——MaaS做第一,把AI的云原生的产品栈打磨好,把组织建设好。
有变化的一点,前年写的是扩大云市场份额,今年改成了聚焦在AI云上。
智能涌现:你自己这两年最大的变化是什么?
谭待:英文变好了一点,因为要见好多海外客户。
智能涌现:对组织和管理有什么新的思考?
谭待:第一,最重要的还是把战略想清楚,不要老变,要看得更长久。火山在AI这件事上战略做得比较早,也比较坚定。
第二是人才,多样性很重要。比如最近Seedance就得招一些导演来团队,AI要渗透各行各业,不能纯靠IT背景的人去做。
第三是自己要不断反省,人在看到一点成绩的时候很容易飘。
智能涌现:最近一次的反思是什么?
谭待:不要做太多微观操作。我发现前段时间自己的微观操作太多了,一般你很有自信的时候就容易这样。但现在事情细节太多了,很多事情你又不够了解,少干涉一点会好一些,要信任团队。
智能涌现:火山成立时,定下了2030年千亿营收目标,时间表会提前吗?
谭待:2025年就已经把这个时间表提前了,今年还会再提一点。
智能涌现:时间表不断提前,你觉得现在任何对AI市场的规模预估还是有效的吗?
谭待:我们过去三年都是这样的:年初定一个很高的目标,团队都觉得太难了,然后年中发现快完成差不多了,就要往上调。AI带来的变化比绝大部分人想的都要更大、更快。




