来源:互联网 更新时间:2026-06-23 07:20
超能创意2.0复刻图片
图片处理只是其中一环。豆包还具备了视频解析能力,支持用户上传视频或视频链接来提取逐字稿,甚至可以拆解上传内容的分镜、脚本和剪辑手法。从实际展示效果来看,逐字稿的提取相当流畅,不过剪辑手法的拆解还比较模糊,暂时无法让用户据此进行复刻。
客观来说,相比前代,超能创意2.0的能力提升是跨越式的。这背后是豆包大模型1.6版本的有力支撑——该版本支持深度思考、多模态理解和复杂Agent的构建。此外,超能创意2.0还集成了图片生成模型seedream 3.0、图片编辑模型seededit 3.0和视频生成模型seedance 1.0 Pro。
过去几个月,豆包陆续推出一系列能力更新。除了超能创意,还有AI播客、应用创造1.0、视频通话等能力。视频通话属于与图片生成、音乐生成一样的基础能力拓展,而其他几项则是在基础能力之上构建的场景化Agent,产品化程度更高、优化也更深入。
AI编程支持可视化编辑
这种Agent能力的增加,正在让豆包变得更好用。从最初主打社交的聊天机器人,豆包正在演变为一个“AI助理+AI办公桌面”的组合。AI助理侧重更随身、更人性化的交流沟通,载体是移动设备;而AI办公桌面更强调复杂需求的实现,往往需要PC这样的设备来承载。
沿着这个逻辑,就不难理解为什么豆包App和豆包电脑版会给人截然不同的使用感受。豆包App是很多用户心中的AI伙伴,可以聊知心话,可以一起整蛊朋友,也可以通过视频通话请它帮忙回答问题。豆包电脑版则扮演效率工具的角色,提供了一个用户与豆包一起工作的操作台。
同一个豆包具备了生活和工作两种形态,并能在两者之间毫无违和感地切换。支撑这一切的,是字节搭建起来的越来越明确的AI体系:最底层是火山引擎提供的云设施;上一层是不断进化的豆包大模型;再上一层是作为“AI助理+AI办公桌面”的豆包应用;最上层则是抖音、耳机、眼镜等豆包的载体。
在这个体系中,豆包应用扮演了承上启下的关键角色。“承上”指的是豆包应用与豆包大模型深度融合,能够快速将大模型能力应用化、场景化,成为更具实用性和更低门槛的工具。“启下”指的是豆包应用是字节对外输出to C AI能力的核心枢纽,串联起字节旗下不同的软硬件应用。
这也是为什么市场普遍认为,字节是国内诸多AI厂商中展现出更强野心和更完整思考的一家。其中一个关键信号是:豆包现在的布局已经考虑到了硬件的变化。目前的豆包应用分为两个形态,是为了适应移动端与电脑端的差异化定位。但如果有一天,移动端与电脑端基于眼镜或其他硬件实现了融合,那么AI办公桌面形态的豆包也能快速融入AI助理形态中。
## 从社交到效率的变化
从诞生之初到现在,豆包的基础定位一直没变:一个能长期陪伴用户的助理。陪伴和拟人化给了豆包一个确定的物种定义。在此基础上,随着豆包大模型能力提升,这个新物种也逐渐成长出更丰富的能力,开始扮演更多样的角色——这其实很像人类从婴儿到融入社会的成长路径。
这个发展路径决定了豆包会首先向聊天能力要增长。豆包App上线初期,团队对它的定位是一个通过“打电话”交互方式提供陪伴的产品。去年在与另一个AI产品团队交流时,对方也认为豆包的目标是做AI社交,类似Character.AI这类产品。
在陪伴聊天的基础上,当时的豆包还拓展出一个聊天机器人生态。用户可以定制不同角色的聊天机器人,发布到豆包的智能体页面,供其他用户选择和使用。即便出现了英语外教、考研面试官、PPT专家、风水师等更具职业属性的聊天机器人,豆包App也仍然是一个倾向于角色扮演聊天而非任务处理的产品。
变化是随着大模型能力提升而出现的。豆包开始融合文生图、文生视频、音乐生成等基于大模型能力发展出来的基础功能。同时,豆包上线了电脑版——这是一款以浏览器形态出现的效率优先产品。用户很少在豆包电脑版上与它闲聊,大部分时间都是在让它帮助完成更复杂的任务。
年初DeepSeek的引爆,让AI以更快的速度从有趣向有用过渡,也带动了豆包的能力提升。视频通话就是模型能力提升给豆包带来的一个显性变化。用户可以在日常生活中依靠视频通话能力,实时向豆包提问,了解门店展示商品的具体信息,或让它根据场景给出拍照的操作指导。
在深度理解、思维链等技术的支撑下,豆包也开始基于基础能力完成创意生图、代码编写等更场景化的工具开发。利用超能创意能力,豆包可以批量生成效果不错的海报;同时,应用创造也支持对豆包生成的网页进行可视化调整。这样的豆包实现了从社交产品到效率工具的拓展。
## 既是助手,也是操作台
从社交工具到效率工具的拓展,进一步分化了豆包在App和电脑版上的呈现形态。简单来说,豆包App是一个更强调陪伴、拟人化交互、能完成轻量化任务的随身AI助手;豆包电脑版则是一个强调效率、工具属性、能完成复杂任务的AI办公桌面。两者都是豆包,但各有侧重。
当你第一次下载豆包App并打开时,它会用语音进行自我介绍,给人更像与人沟通的感觉。豆包App的界面底栏有通话、发现、AI创作三个按钮。通话列表中不仅有豆包,还会显示用户沟通过的其他聊天机器人;发现是聊天机器人的集合;AI创作则提供创建聊天机器人、生成图片、音乐、AI写真等功能。
进入与豆包的聊天界面,会显示豆包的头像,并且优先展示豆包P图、拍照答疑、照片动起来等生活化、轻量化的能力。这样的豆包App给用户的感觉就是一个能聊天沟通且能随手帮忙的伙伴。这种强陪伴属性,也能解释为什么会有即将离世的老人对豆包说出:“我要去世了,豆包”。
如果说豆包App更侧重于呈现AI拟人化的一面,那豆包电脑版则是一个“无情”的操作台。它的主界面不像豆包App那样侧重聊天,而是一上来就强调任务执行能力。无论是脱胎于搜索框的聊天框,还是侧边栏中对AI搜索、帮我写作、AI编程、图像生成的推荐,都透着很强的效率工具感。
相较去年,豆包电脑版的一个变化是在侧边栏中隐藏了聊天机器人的入口。以前位于历史对话下面的“我的智能体”入口被隐藏起来,变成了AI云盘,并移到了历史对话上方。同时,豆包电脑版的第三方聊天机器人与豆包App相比更为精简,基本没有纯聊天的角色,都是一项项具体任务的执行者。
这种“AI助手+AI办公桌面”的组合让豆包更适合目前的载体形态。作为AI助手的豆包不仅能以App形式存在,还能切入到抖音、浏览器、智能耳机、智能眼镜中,随时被唤醒和互动。在软件层面,豆包已经被放入抖音的聊天列表,甚至正在灰度测试将豆包与抖音视频页面的点赞、评论转发放在一起。在硬件层面,Ola Friend依靠豆包App承载设备管理和更新,并能随时召唤豆包。
作为AI办公桌面的豆包,目前出现在电脑版和网页版中,更符合用户在电脑桌面上使用AI完成复杂工作的习惯。无论是对网页生成,还是对要求更高的图像创意来说,移动端都还无法很好地承载。一个操作台形式的豆包,既符合用户的工作习惯,也提供了Agent所需要的自由画布。
## 豆包是字节AI to C的核心
在to B领域,字节打出的牌是火山引擎加飞书的组合,其中作为AI操作台的多维表格和作为AI助手的飞书知识问答承载了B端用户的主要AI交互需求。在to C领域,豆包是字节AI体系的核心——它既是AI助手,也是AI操作台,并且有能力承担串联字节体系内不同C端入口的任务。
一方面,豆包强调拟人化。打造一个像钢铁侠的贾维斯一样的AI助手,是一个激动人心的故事。从贾维斯身上,我们能看到的是一个活生生的人。这种活人感是AI产品具备记忆力和成长力的体现。豆包对拟人化的强调,实际上也是在让AI与用户一同成长,使其成为最了解用户的“家人”——这是在构建一个长期的情感壁垒。
另一方面,豆包的核心是AI,而非某一类端口形态。App、网页、硬件、Copilot等端口形态,不过是豆包发挥作用、输出AI能力的载体。在豆包身上,我们能看到类似Gemini的雄心。字节也像Google一样,在围绕豆包搭建一个面向AI的完整体系,包括与自身流量入口的打通,以及硬件的研发。
与Ola Friend的合作,是豆包在融合AI硬件层面迈出的第一步。从市场反应来看,这次尝试并没有激起大的浪花,但对字节而言,这可能是一个积累经验的过程。眼镜或许是更适合豆包的硬件载体,也是字节能有更大底层掌控权的硬件设备。
据The Information报道,字节已经在研发没有显示模组的AI眼镜和具备显示模组的MR眼镜。前者更匹配AI助手形态的豆包,后者是款护目镜形态的轻量级混合现实设备,更有希望落地AI助手+AI办公桌面的完整版。如果眼镜能成为PC之外的另一个大屏,那么豆包的助手角色和桌面角色就能在移动端实现统一,打造出一个软硬结合、可轻可重的完整体豆包。
不过,相比Google,字节在模型能力、硬件系统、入口能力上都还有欠缺。可以看到字节在不断提升模型能力,并依靠垂直研发的优势,将模型能力与场景化需求更快结合起来,快速更新豆包的能力组合,实现像超能创意一样的产品化。据火山引擎CEO谭待介绍,火山引擎有专门的团队,可以参与到模型研发和产品开发中。豆包这半年的能力更新,在一定程度上验证了这种优势。
字节跳动CEO梁汝波表示,在AI大模型带来的技术变革时代,字节跳动也要对自己提出更高要求——做优秀的科技公司还不够,得做优秀的创新科技公司。前者是能够利用先进技术的公司,后者则能探索和发明新技术,这是挑战非常大、有非常高天花板和想象力的事情。
豆包无疑会是字节这种技术创新能力的核心出口,字节对豆包的投入并未缩减。App Growing的数据显示,2024年Q2至2025年Q1,豆包季度平均投流费用为1.5225亿元;相比之下,即梦AI的投流费用在2025年Q1仅为270万元。更重要的是,豆包在5月的活跃用户数已达到1.31亿,仍在保持增长势头。
这也意味着豆包需要继续通过聚合入口和能力建立护城河,让自己成为字节想要的系统级能力。但从目前的使用体感来看,豆包还欠缺一种串联一切的感觉。 《Off Campus》第二季官宣:这对CP还在,但不再是主角
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
帅气继父网名女生可爱英文(精选100个)
帅到极致的网名女生霸气(精选100个)
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
如何在夸克浏览器中开启网页视频的倍速播放功能?
蒙古上单是什么梗
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
作家助手如何上传自制封面 作家助手如何设置小说的封面
韦一敏是什么梗
韩漫小少爷网名大全女生(精选100个)
archiveofourown 实战指南:常见用法整理
网络热词聊污是什么意思
抖音最火沙雕男生网名(精选100个)
有寓意的易经网名男生(精选100个)
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
小众游戏抖音网名男生(精选100个)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc