热门搜索:和平精英 原神 街篮2 

您的位置:首页 > > 教程攻略 > ai教程 >刚刚,OpenAI 版 Nano Banana 发布:奥特曼秒变性感男模|附实测

刚刚,OpenAI 版 Nano Banana 发布:奥特曼秒变性感男模|附实测

来源:互联网 更新时间:2026-06-20 07:30

上半年GPT-4o刚出来那会儿,热度确实炸裂,奥特曼估计都在机房闻到了GPU烧焦的味道。从那以后,生图和视觉理解几乎成了所有大模型不得不标配的功能。

但到了下半年,真正抢走所有风头的,反倒是那根「香蕉」——Nano Banana。

为了把王座重新夺回来,OpenAI今天正式推出了最新的图像视觉模型:GPT-Image-1.5。这是继GPT-5.2之后,OpenAI红色警报计划里打出的又一记重拳。

先说几个核心结论:指令执行更准了、编辑更精确了、细节保留更完整了,而且速度比之前快了整整4倍。

告别「抽卡」玄学,编辑细节能力拉满

要说这次最大的升级点,那就得好好聊聊这个「精准编辑」能力了。

以前用AI改图,简直像碰上了一个听不懂人话的「托尼老师」——你就想修修刘海,它反手就能给你剃个光头。现在好了,模型终于能听懂人话了。你改哪里,它就动哪里,不瞎折腾。

光线、构图、人物特征,在输入、输出和后续编辑的整个闭环里都能保持得稳稳当当。

听起来有点抽象?直接看官方给出的示例:

先是把两个男性和一只狗合成到一张2000年代胶片风格的儿童生日派对照片中;然后添加背景里吵闹投掷东西的孩子们;再把左边的男人改成复古手绘风格,把狗变成毛绒玩具风格,右边男子和背景完全保持不变;接着给所有人换上OpenAI毛衣;最后只把狗留下,把整个画面扔进一场OpenAI的直播里……

这一套连招打下来,画面的逻辑居然没有崩掉。这说明GPT-Image-1.5不再是靠「蒙」的,而是真正理解了画面的结构,能完成增删改查这种精细操作。能改得准、稳得住,这才是今天真正的技术护城河。

再来看几个实际测试的案例。你或许看过《千里江山图》这幅传世名作,但可能还遗漏了亿点点细节。

同理可得,谁说《百骏图》里不能突然出现一只从现代穿越过来的网红柴犬Kabosu?

甚至连马斯克和扎克伯格那场没打成的笼中决斗,在GPT-Image-1.5的加持下,一次性就成功把主角换成了奥特曼。脸没崩,违和感也几乎为零。

我们要一张细节丰富、逼真写实的极端仰拍照片:马斯克坐在珠江岸边,单手搭着广州塔尖。为了体现那种巨物感,还得在他的脚边撒上一些微小的游船和游客。结果,它确实懂了什么是「比例感」。

提示词:一张细节丰富、逼真写实的极端仰拍照片,画面中的马斯克坐在珠江岸边,一只手搭在广州塔的塔尖上。为了体现巨大的体型比例,可在他的脚边加入一些微小的游船、观光游客等,2K,16:9。

终于不再画「鬼画符」,但中文表现……

相比初版图像模型,GPT-Image-1.5更擅长遵循那些复杂、细致的指令,也能更好地保持各元素之间的预设关系。

官方展示了一个6x6的网格图案例:每一行都要按指定内容布置,希腊字母、动物、物品、图标、单词……模型排列得井井有条,强迫症看了都得说声舒服。

经过实测,把线稿转成真实图片这种操作,现在也成了基本操作。

文本渲染能力也进一步提升,能更好地处理密集、小字体的内容。比如将一段Markdown格式的内容呈现为自然的报纸文章布局,内容包括GPT-5.2发布说明、性能基准对比等,格式和数字都能保持完整准确。

这个能力听起来可能不起眼,但对于需要生成海报、宣传图、信息图表的用户来说,简直就是刚需。在Nano Banana Pro出现之前,生成式AI的文本渲染一直抽象得离谱,现在终于能看了。

不过得泼盆冷水:GPT-Image-1.5的英文能力确实能打,但中文表现依然是灾难现场。让它画个「擎天柱征服火星」的中文漫画,它就能给你自创一门火星文。

又或者让它生成一张古人在墙壁上写《水调歌头》的图片,结果文字错漏百出,握笔姿势居然还是拿钢笔的手法。

好在生成速度快了4倍,这边还在画着,那边你可以同时开几个新任务,试错成本大大降低。物体知识储备也还算在线,问它往水里加盐鸡蛋会怎样,生成的图片倒是有模有样。

左为原图,右为生成的图片。提示词:如果往水中加入大量盐,生成一张图片,展示鸡蛋会发生什么。

博主@Yuchenj_UW认为,GPT-Image-1.5的生成效果大致达到了Nano Banana Pro的「专业级」水准,但「智商/推理能力」明显落后于Nano Banana Pro,尤其在数学题、物理或迷宫这类问题上表现更差。

你的下一位设计师,何必是人?ChatGPT申请出战

OpenAI这次还在ChatGPT里专门开辟了一个图像创作入口。网页和移动端的侧边栏都能看到这个新入口,里面塞满了预设滤镜和热门提示词,还会定期更新。上传一次肖像,以后张张都是你,不用反复喂图。

说实话,这个功能Nano Banana没有,但国内的生图模型早就玩烂了。某种程度上,GPT-Image-1.5也算是在摸着国内同行的石头过河。

就在刚刚,奥特曼也在社交媒体上分享了自己用GPT-Image-1.5生成的圣诞性感月历男模照片。

既然来了,我们也顺手给奥特曼换了几套皮肤:贴纸风、摇头娃娃风、素描风。预计今天过后,他又要成为互联网上最忙的男人。

有个细节很值得点赞:当你要求生成预设方案时,OpenAI会公开预设的提示词。从这一点来看,OpenAI确实挺「open」的。

除此之外,制作贺卡、创建专辑封面、修复老照片、拍摄专业求职照片等,也都是非常实用的预设方案。比如那张经典的鲁迅和泰戈尔的合照,经过修复后,效果确实挺不错。

OpenAI应用CEO Fidji Simo在博客中写道:「人类的思维并不只是由文字组成。事实上,我们最有创意的想法,往往起源于脑海中的图像、声音、动作或模式。」

她透露,ChatGPT正在从一个反应式、以文本为核心的产品,转变为一个更直观、更能贴合你各种任务需求的工具。从纯文字向多媒体和动态界面转变,是这一进化过程中非常重要的一步。

很多用户第一次接触ChatGPT,都是通过文字生成图片。但ChatGPT的聊天界面最初并不是为此设计的。图像创作和编辑是一种完全不同的任务,需要专门的视觉空间来支持。于是,OpenAI干脆给它搞了个专属入口,让图像生成有了一个更像创意工作室的环境。

OpenAI的计划还不止于此。未来还将引入更多视觉元素,优化ChatGPT的整体体验。比如在进行搜索查询时,结果将更多地包含图片和清晰来源。在单位换算或查阅体育比分等任务中,你需要的是一目了然的可视化结果,而不是一段文字描述。

甚至写作体验也在改。未来内置的写作模块让你在聊天中就能直接编辑,还能一键导出PDF或直接调用邮件应用发送。ChatGPT早已不是一款单纯的语言模型,它正在变成一个真正的多模态工作台。

当然,除了普通用户,开发者也能通过API用上GPT-Image-1.5。

相比GPT-Image-1,GPT-Image-1.5具备更强的品牌元素与关键视觉保持能力,非常适合电商、品牌营销等需要生成大量变体图片的场景。图像输入输出费用降低了20%,同样预算能生成更多图像。

降价+提效,这套组合拳打得还是挺实在的。

除此之外,迪士尼上周已经宣布向OpenAI投资10亿美元,并达成了合作协议。根据这项为期三年的授权协议,OpenAI旗下的Sora和图像生成模型都能生成迪士尼、漫威、皮克斯和星球大战旗下的角色,并计划在明年初正式上线相关功能。

内容IP加上AI生成,这背后的想象空间确实挺大。

更重要的是,GPT-Image-1.5的发布,标志着图像生成工具正在从「玩具」向「工具」转变。目前市面上大多数AI改图工具,一改就崩,毫无一致性可言。GPT-Image-1.5至少在这个方向上迈出了坚实的一步。它开始具备后期编辑能力,能像Nano Banana Pro一样控制细节,确保画面连贯。

此外,在模型能力本身还不够强的情况下,GPT-Image-1.5通过更完善的图片生成预设方案以及功能设置,来完成对新版Nano Banana的反击,确实是一个不错的选择。专属图像创作入口、预设滤镜库……这些看似不起眼的产品设计,恰恰击中了普通用户的痛点。很多人并不需要最强的模型,他们需要的是能快速上手、不用反复调教、生成结果八九不离十的工具。模型能力领先只是第一步,如何把能力转化为好用、易用、爱用的产品,才是真正的护城河所在。

AI自动绘画大师
AI自动绘画大师

类型:益智休闲

大小:5.72MB

语言:简体中文

平台:互联网

游戏下载

热门手游

相关攻略

手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc