来源:互联网 更新时间:2026-06-05 14:30
字节跳动商业化技术团队最近开源了一个新的视频生成与编辑框架,名字叫Bernini。这套框架的核心思路其实挺有意思——它主打“先理解、再生成”的协同机制,说白了,就是先让模型真正读懂你要什么,再去生成画面。老模型经常因为搞不清复杂指令而出现画面失控、帧间闪烁这些头疼问题,Bernini正是冲着这些痛点来的。
目前,字节自家测试显示,Bernini已经把性能稳在了行业第一梯队。推理代码和第二阶段的模型Bernini-R已经开放权限,等全功能版本一到,就可以正式全面上手了。

Bernini在工作流程上做了一个很巧妙的拆分:把整个处理过程分成“语义规划”和“视觉渲染”两件独立的事。系统先让一个多模态大模型规划器去深度解析输入的素材,勾勒出一份“语义草图”,然后渲染器再根据这张草稿,把目标转化成稳定、连续的视频画面。
这种清晰的分工,让它在可控编辑上表现出了很高的实用价值。你只要给个简单指令,就能让画面里的天气、季节和视觉风格自然地变化,甚至还能精准地控制镜头角度、焦点和主体动作。说白了,这就等于把视频创作中的“想清楚”和“画出来”分给两个专家去做,效果自然比一个人全包要好得多。
除了传统的文字操控,Bernini还支持拿图片和视频当视觉参考,这大大提升了创作的一致性。比如在视频编辑场景里,你可以把特定的材质或海报精准地塞进目标区域,而且边界不破、透视不乱,看起来就像本来就在那里一样。
在新视频生成方面,这个模型不仅能支持单图和多角度参考生成,还能完成从关键帧到连续镜头的自然演变。更值得一提的是,团队专门引入了一套专属的位置编码机制,用于解决多视觉片段串联时模型容易混淆的问题——这样一来,参考素材和输出目标就能分得清清楚楚,不会乱套。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
免费影视剧APP推荐
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
帅气继父网名女生可爱英文(精选100个)
网络热词聊污是什么意思
抖音最火沙雕男生网名(精选100个)
蒙古上单是什么梗
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
韦一敏是什么梗
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
作家助手如何上传自制封面 作家助手如何设置小说的封面
免费看片软件下载地址推荐
免费看电影的软件推荐
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
有寓意的易经网名男生(精选100个)
三角洲行动卡战备怎么弄 三角洲行动卡战备攻略
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc