来源:互联网 更新时间:2026-07-01 15:42
说到底,Coding这事儿上谷歌是有点落后,但在多模态这块,人家确实有两把刷子。
今天,Gemini Omni Flash正式开放API——说白了,就是视频版的Nano Banana。效果有多炸裂?看看官方拿它表演的这四个数字魔术就知道了。
<iframe class="entity-iframe" style="height:250px;width:450px;" data-type="video" data-id="3876410804318467" scrolling="no" frameborder="0"> </iframe>
这一致性和文字清晰度,还要啥绿幕和特效?直接现场直播奇异博士都不成问题。
与此同时,大家一直念叨的「香蕉」,也等来了一个光速版。
4秒一张图,1024分辨率成本才2毛出头,这速度只能用「离谱」来形容。

和Nano Banana 2放在一起,速度直接起飞。更别说那个一次生图能干三分钟的GPT Image 2,差距简直不是一个时代的。
<iframe class="entity-iframe" style="height:250px;width:450px;" data-type="video" data-id="3876412418338819" scrolling="no" frameborder="0"> </iframe>
怪不得Gemini 3.5 Pro憋半天不出来,敢情时间全花在多模态上了是吧,哈萨比斯?
这个模型早在今年Google I/O上就亮过相,把Gemini的多模态推理能力和视频生成、编辑深度结合,当时就引发了不少关注。如今正式通过API和Google AI Studio向开发者开放,能基于文本、图像、视频等多种输入直接生成和编辑视频。
来看它的四项核心能力:

价格也很有竞争力,每秒视频产出只要0.10美元,跟Veo 3.1 Fast一个价位。定位上,Omni Flash更像轻量版的视频生成模型,但特别强调了Gemini的世界知识整合,整个生态也在全面朝Gemini层靠拢。
不过谷歌也挺坦诚,主动列了不少现阶段的局限:目前只支持10秒视频;不支持音频参考上传和场景扩展;API虽然能接收最长3秒的视频作为参考素材,但模型还没法正确处理这类输入;场景切换和运镜时的人物一致性也还有待改进。
这个模型(官方代号 gemini-3.1-flash-lite-image)专为高速而生。优化方向很明确:那些对延迟极度敏感、需要批量处理大量图像的实时场景——电商素材批量生成、广告创意快速迭代、自动化内容流水线,就是它的主战场。
两大核心卖点:
速度砍了,价格也砍了,但生图和图像编辑能力并没有缩水。Nano Banana 2 Lite的文字渲染效果依然出色,在benchmark上和Grok等模型处于同一水平线。

谷歌的建议很直接:如果还在用初代Nano Banana,赶紧换。Lite版各项关键指标已经全方位碾压了。
等等,别急着走。
本以为这只是两款并行的模型发布,没想到谷歌还有新花样。
真正的神奇之处,在于将这些模型串联起来使用。
AIGC创作需要反复迭代,素材管理一直是个麻烦。现在有了这两个模型,流程彻底打通了——图像生成和视频创作无缝衔接,不用再反复上传文件。
具体操作很简单:先用Nano Banana 2 Lite高速出图,再把生成的图像作为参考素材喂给Gemini Omni Flash,一键转化成视频。
为了展示这套1+1>2的魔法Workflow,谷歌专门做了三个Demo APP:
自拍一张或者上传照片,NB2 Lite瞬间把你P到几十个地标景点里。点一下图片,Omni Flash就把静态景点变成动态短片。赛博旅游,这下也端到端了。
<iframe class="entity-iframe" style="height:250px;width:450px;" data-type="video" data-id="3876414455951368" scrolling="no" frameborder="0"> </iframe>
这个有点吓人。上传一张房间照片,NB2 Lite先出各种装修风格方案,找到喜欢的,点视频按钮,Omni直接生成一段电影级空间漫游。配合Genie世界模型,怕是能威脅到不少传统设计软件公司。
<iframe class="entity-iframe" style="height:250px;width:450px;" data-type="video" data-id="3876415505805575" scrolling="no" frameborder="0"> </iframe>
跨境电商的福音来了。给产品拍张白底图,NB2 Lite自动生成各种场景化商品图,Omni Flash再把这些静态图变成电商短视频。从「产品」到「广告素材」,全链路自动跑完。
<iframe class="entity-iframe" style="height:250px;width:450px;" data-type="video" data-id="3876416353661187" scrolling="no" frameborder="0"> </iframe>
这个问题谷歌肯定被问过无数次了。2026年的今天,Coding几乎就是模型智商的代名词,每家都在死磕代码。但谷歌非要死磕多模态,图什么?
AGI叙事那一套就不展开了。短期来看,这套多模态模型确实能赋能旗下不少产品——Stitch是一个,Pixel内置的P图工具也是一个,NotebookLM的横空出世更是让人眼前一亮。
这次发布的两个新模型,让人看到了多模态在垂直场景落地的更多潜力。电商、装修、短视频……这些业务的需求是真的,钱也是真的。加上有安卓生态加持,商业化基本不用担心。
Coding谷歌暂时追不上,但多模态这张牌桌上,谷歌可能是唯一能凑齐一套牌的玩家。
不过话说回来……

详情可查看官方博客。
archiveofourown 实战指南:常见用法整理
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
电视剧《小欢喜》剧情介绍
俄罗斯最大yandex入口外贸日报直达链接
如何在夸克浏览器中开启网页视频的倍速播放功能?
《梦幻西游》159五开五门怎么搭配-159五开五门常见搭配
美好的简约网名男生(精选100个)
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
腾讯元宝怎么用来分析股票基金的基本面信息?
盖乐世社区怎么删除帖子?盖乐世社区个人发布内容撤回步骤
二次元男生网名可爱(精选100个)
wallpaper壁纸声音怎么开启
问题:CIA币好不?Cia Protocol币今日上线:价格预测、代币经济学和未来潜力
免费观看国外短视频的app有哪些 观看国外短视频的软件下载
国际贵金属走低,现货黄金价格跌0.49%
新浪人工智能热点小时报丨2026年06月20日02时_今日实时人工智能热点速递
独家/李宰旭入伍前「登上孤岛服役」 惊见前辈裸体:忍不住笑了
动漫《无赖勇者的鬼畜美学》剧情介绍
短剧《嫡女她是山大王》剧情介绍
AO3网址链接入口 教程:从入门到实际使用
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc