来源:互联网 更新时间:2026-05-30 10:14
年初,Seedance 2.0的亮相,算是给AI视频参与影视工业化流程这个方向点了一把火。
短剧、广告、电商这些场景,现在已经开始把AI视频往实际生产流程里塞了。说白了,AI视频模型正从“刷榜单”过渡到“干活”阶段。创作者关心的早就不只是模型参数和榜单排名了,大家更在意的是:这模型能不能稳定出片?能不能支撑连续镜头生成?最关键的是,能不能最终嵌入到一套可复用、可协作、可交付的工作流里?
字节跳动的Seedance 2.0,正是在这种背景下被推到了聚光灯下。
西安一位短剧从业者提到:“相比不少模型对提示词的精细度要求特别高,Seedance 2.0就算你给的提示词短一点、抽象一点,它也能自己内部扩写成更专业、更详细的描述。这就相当于把普通人的表达,翻译成模型能执行的镜头语言,直接降低了使用门槛。”
与此同时,快手可灵、阿里HappyHorse也在加速迭代;爱奇艺纳豆、群核科技LuxReal这些玩家,则从工作流、数字资产、3D空间和协作工具这些角度切入;生数科技、爱诗科技、MiniMax、商汤等垂直玩家也在加紧卡位。
模型、平台、工具链……各个方向的玩家都下场了,AI视频赛道俨然成了条拥挤的高速路。
从厂商层面看,竞争梯队已经拉得很开了。
互联网大厂这边,字节有Seedance(即梦),快手有可灵,阿里有HappyHorse。长视频平台爱奇艺也下了场,推出了面向短剧专业制作的AI创作平台“纳豆”。大厂之外,垂直玩家更是扎堆涌入:生数科技的Vidu、爱诗科技的PixVerse(拍我AI)、MiniMax的海螺、群核科技的LuxReal、商汤的Seko……都在拼命占位置。
过去这一年,围绕AI视频模型的榜单多到让人眼花缭乱,各种模型排名、样片对比层出不穷。这些榜单确实放大了行业热度,也让外界能更直观地看到模型之间的能力差距。
从这个角度看,Seedance 2.0之所以被关注,正是因为它已经被嵌入真实生产流了。
AI短剧制作公司可梦智能的内容负责人刘城提到:“无论是对视频内容的理解、对物理世界规律的把握,还是表演的自然度,Seedance 2.0都有大幅提升。”
以视频内容的理解来说,刘城认为Seedance 2.0对抽象语义的理解进步明显。“虽然最后生成的结果还有不确定性,但已经做得很不错了。比如提示词是‘让这两个人在场景中产生暧昧的互动’,AI会分析并生成两个人之间带有暧昧感的光影和色调,人物的镜头运动也会变得更缓慢——它会根据需求自动补充这些元素。”
不仅如此,他举例说,原来一些武打动作、复杂的多人交互场景,经常出现穿帮、穿模、人脸模型错位等问题,经过Seedance 2.0之后,基本都解决了。“有些视频,你根本看不出来是AI还是真人。”
重庆一位短剧从业者也表达了类似看法:“Seedance 2.0出来后,人物、口型和声音的一致性保持得比以前好,画面的油画感弱了很多,分镜设计上也更聪明了。”
据西安一位AI短剧行业人士透露,在Seedance 2.0的加持下,通过优化提示词,现在一到两次就能生成一段10秒左右的视频,最多三次就能达到满意效果。“如果熟练的话,一部50集的真人AI短剧,两周左右就能完成了。”
一位正在创业、专注AI短剧工具的开发者星熹认为,字节跳动接入Seedance 2.0模型的即梦,功能易用性比其他厂商完善。即梦视频生成的全能参考模式能较好地理解九宫格分镜图片——上传一张包含九个分镜头关键帧的图片后,可以基于分镜图标注的顺序自动推理生成视频。不过大家迭代速度都快,其他工具也陆续有了这个功能。
至少在这一轮AI视频竞争中,Seedance 2.0已经率先把模型能力从“可用”推向了“更接近生产级”,后来者的追赶压力也随之加大。
尽管Seedance 2.0是断档式的存在,但AI视频行业的共性问题依然存在。
学界也在探讨解法。比如北京大学计算机硕士生袁盛海团队的论文《Identity-Preserving Text-to-Video Generation by Frequency Decomposition》,想解决的就是“文字生成视频时,如何让同一个人物在不同帧、不同动作、不同角度中保持一致性”。他们提出的技术框架ConsisID,把人脸特征分成高频和低频两种信号,再分别让模型学习,以此降低学习难度。袁盛海解释:“之前大家直接把原图丢给特征提取器,我们认为这样反而提升了模型学习难度。我们查阅文献发现,人脸特征确实可以分为高频和低频。高频信号对应人脸细节,如面部纹理和眼睛;低频信号则与全局特征相关,包括人脸骨架、五官相对位置。把这两种特征分开学习,模型会更容易掌握。”

据刘城透露,可梦智能在项目生成中采用了AI辅助功能。例如,团队开发了分镜提示词和草图功能,用户修改提示词后,AI可以完成80%-90%的创作。灵活运用AI提示词的用户,还能通过进一步微调提示词来提升效率。
群核科技则把工作流优化做到了3D层面。5月27日,他们推出了短剧版的LuxReal。基于自研空间大模型等3D技术,LuxReal能将2D画面场景生成可漫游的虚拟3D空间。创作者可以自由调整机位、设置人物站位,系统基于同一个3D场景自动渲染对应画面。不过实际生成质量还有待观察——虽然LuxReal为短剧工作流的设置比较完善,但主动思考的优化程度仍需提升,存在人物衣着与时间背景不符等问题。
爱奇艺的纳豆接入了自研和Seedance 2.0等外部模型,结合爱奇艺IP库、数字资产库和创作者社区,形成可调用的平台能力,为创作者提供从内容生产到运营的全链路支持。其中,IP库和数字资产库是爱奇艺的独特优势。例如在数字资产库里,创作者可以调用《成何体统》中的皇宫、《花戎》的魔界大等电视剧中的场景、武器、动物等IP形象。不过从目前观察来看,爱奇艺虽然拥有丰富的IP库和数字资产库,但目前在纳豆平台上呈现的数量仍然有限。
无论是长视频稳定性、人物一致性,还是可控性,现阶段的AI视频行业确实还存在很多需要解决的痛点,竞争格局远未到收敛的时候。
在这种情况下,资本化成了部分厂商加足马力的重要选择。
今年5月,市场传出快手正在加速推进可灵的分拆上市,计划明年启动独立IPO,Pre-IPO轮估值预计达200亿美元。随后快手在港交所公告中确认,董事会正评估重组可灵相关资产及业务的方案。无独有偶,垂直玩家也在加快融资和上市准备。生数科技在两个月内连续完成两轮共计逾26亿元融资后,也被传计划于2026年上半年启动港股IPO,其工商主体已于3月底完成股份制改造。
这些资本动作背后,折射出AI视频赛道的另一重现实:模型竞争不只是一场技术竞赛,更是一场资金、算力、数据和场景落地能力的综合竞争。与此同时,AI视频的商业化仍处在早期阶段。短剧、广告、电商、游戏、影视预演等场景虽然已经开始验证需求,但距离形成稳定、规模化、高毛利的收入模型,还需要时间。
正因如此,资本市场的资金支持,某种程度上成了不少厂商继续留在牌桌的重要筹码。
当前AI视频赛道的竞争,并没有因为Seedance 2.0的阶段性领先而结束。相反,随着更多厂商补充资金、加速产品迭代,行业很可能还会继续经历一轮模型能力、生产工具和商业化效率的竞速。
下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
初中英语同步课文跟读APP推荐|免费下载高口碑跟读软件排行榜
BuuPo官网在哪下载 最新官方下载安装地址
4D采矿者官网在哪下载 最新官方下载安装地址
阅读app安卓版下载推荐
碎片人偶Vragmeet官网在哪下载 最新官方下载安装地址
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
无尽花界时装合辑
免费影视剧APP推荐
喧哗番长乙女 2nd Rumble !!官网在哪下载 最新官方下载安装地址
纸嫁衣9官网在哪下载 最新官方下载安装地址
萌神契约手游下载安装
好用的手环阅读app下载安装
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
人声接近真人!OpenAI一口气更新三款超强语音AI
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
短视频软件推荐
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc