热门搜索:和平精英 原神 街篮2 

您的位置:首页 > > 教程攻略 > ai资讯 >大厂的Agent之争在沿着四条主线演变

大厂的Agent之争在沿着四条主线演变

来源:互联网 更新时间:2026-06-08 15:12

实现Coding Agent向通用场景的泛化是系统级竞争

这一周,AI领域的重磅消息接踵而至。黄仁勋重新定义AI PC,微软Build 2026高喊“Agent优先”,OpenAI正式合并ChatGPT和Codex,微信Agent进展曝光,千问开始接入第三方Skill,豆包回应付费传闻,美团财报会上强调服务AI Agent正变得越来越重要。大厂的动作频率和力度,都在刷新行业预期。

之前不少人问:OpenClaw怎么突然没人提了?本周的消息给出了答案——不是因为被遗忘,而是因为它的内核已经被各大厂内化吸收,变成了通用方案。

Coding Agent正在成为执行任务的通用方案,并与Chatbot走向融合,与之匹配的Skill和Agent生态也开始建设,新的付费模式正在探索中。

大厂正在把OpenClaw带来的启发转化为真实的业务进展。这个过程中,无论是OpenClaw本身,还是我们现在看到的这些产品,很可能都不是AI产品的最终形态。就像腾讯首席AI科学家姚顺雨在2026腾讯云AI产业应用大会上所说,一场长周期的变革才刚刚开始,真正的产品形态、商业机会和使用方式,还远没有被充分发明出来。

可以确定的是,Agent正在成为大厂AI的核心战场,而这场竞争的形态正在沿着四条主线演变:

谁能拓展更多生产力场景的用户;谁能更深度打通内部产品;谁能建立起足够丰富的Skill、Agent生态;谁能积累足够的上下文。

「同事」成为Agent的竞争焦点

如今,大厂最爱用“同事”这个词来描述Agent。微软的Scout被设计成“像同事一样”工作;扣子3.0强调让人和AI团队一起协作;OpenAI推出的Agent插件则被形容为“已办完入职、懂全套流程的新同事”。这些表述背后,其实指向同一个方向:

生产力场景已经成为大厂Agent的竞争焦点。

微软推出的Scout,就是基于OpenClaw框架打造的Agent,常驻Microsoft 365,能在Teams中运行,与Outlook、OneDrive等办公应用协同,浏览邮件、日历、工作消息,自动处理会议冲突、起草回复、推进任务。同时,微软还推出了Agent 365,为企业统一管理Agent的身份、权限、策略和风险。这整套打法,瞄准的就是办公效率这个最大的生产力场景。

OpenAI则直接把发布会的主题定为“Intelligence at Work”。在会上,Codex迎来了三项核心升级:可定制能力的Agent插件;局部批注修改能力从代码和网页拓展到文档、表格和PPT;以及通过生成网站来进行产出汇报的能力。说白了,就是要让Codex从编程助手升级为全流程的工作助手。

豆包也在回应付费功能时透露,针对专业人群的生产力需求,计划推出豆包专业版,将包含软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究等专业服务。可以看出,生产力场景的价值已经得到真金白银的验证。

数据也印证了这一点。OpenAI的数据显示,今年2月以来,Codex的周活增长了6倍,达到500万,其中

知识工作者的增速是开发者的3倍

。Anthropic第二季度的收入预计将增长逾一倍,达到109亿美元,并可能实现5.59亿美元的营业利润,其收入大多来自企业和初创公司。这都表明,Agent在生产力场景中找到了真正的增长引擎。

内部产品的整合与连接在不断深化

产品更新背后,是更深层的产品架构重组。一方面,

大厂基本都布局了Chatbot和一个或多个Agent产品,整合已经开始。

其中最激进的就是OpenAI对ChatGPT和Codex的整合。

OpenAI想让ChatGPT从单纯的对话入口,升级为协同Agent工作的主界面,而Codex则会升级为能够满足办公、科研、企业流程、数据分析、业务运营等多场景工作需求的通用Agent平台。其内核,就是对Coding Agent的使用场景泛化。通过这场整合,OpenAI期待将Codex推广向ChatGPT庞大用户群体,扩大付费用户基数。还有消息显示,AI浏览器Atlas也可能参与到这场超级AI应用的整合中去。

另一方面的整合,

是大厂原有的互联网产品能力和服务,在快速以Skill或Agent的形式被整合到AI产品中。

阿里为千问增加点外卖、打车、淘宝购物的能力,是比较早期的探索。现在,字节、美团、腾讯都在做类似的工作。字节在给豆包打通抖音商城之后,又在增加美食、电影票、民宿等本地生活服务的门店及团购套餐推荐。美团在财报会上表示,AI助手“小团”嵌入美团APP,五一期间服务了过亿人次用户,覆盖吃喝玩乐、出行、问诊等场景。腾讯文档也将过去积累的文档处理能力变成Skill,被WorkBuddy调用。

腾讯集团高级执行副总裁汤道生在2026腾讯云AI产业应用大会期间表示,

过去很多传统应用的功能,要转换成可被智能体调用的能力,才能把过去多年积累的价值进一步释放出来。

今年企业微信就在把原来的一些数据能力通过接口、通过Skill开放出来,让其他智能体可以调用。这种开放的趋势越来越明显。

第三方生态建设开始提上日程

Agent与此前产品的一个核心差异,在于它具备工具调用的能力。这就要求Agent背后有一个足够丰富的工具生态。即便是大厂,也很难凭一己之力构建起这个生态。所以,第三方Skill或Agent生态的建设,已经提上了日程。

千问在完成对阿里内部第一方产品、服务的整合之后,宣布将向第三方Agent、Skill全面开放,让所有企业均可在千问运营自己的品牌Agent。本周,瑞幸、肯德基、蜜雪冰城、东方航空已经在千问上线了Skill。

随后企业还能够在千问中自定义Agent人设与具体服务。

腾讯则一方面在将美团的小美接入元宝,为用户提供外卖点餐、配送等服务;另一方面在加速微信Agent生态的建设。媒体报道显示,微信的Agent已完成原型测试,最快将于本月启动公开上线前的合规审批流程。

这个Agent能调度微信小程序,实现点餐、打车、订票、购物及本地生活等复合服务。

此外,微信还在尝试与荣耀、小米等手机厂商建立Agent to Agent的连接,让自己的基础能力能够被手机厂商的Agent调用。这也就意味着,

手机厂商也将成为微信Agent生态的新入口,形成多个入口共用一套Agent生态的架构。

OpenAI的Agent插件,则能够一次性打包岗位所需的工具、知识和技能。比如,创意生产插件可以根据brief生成campaign board、展示广告变体、产品生活方式图、电商图集,并能调用Figma、Canva、Shutterstock、Picsart、Fal等工具。

简单理解,这就像是为Agent准备的一套职业传承体系。

目前Codex的Agent插件覆盖了62个热门应用和110项技能。

后续,OpenAI希望把插件生态开放给合作伙伴,让第三方直接在Codex和ChatGPT中创建并部署自己的插件。

上下文变得更为重要

姚顺雨表示,模型越来越擅长把复杂输入变成输出,但前提是它能拿到足够好的输入。

这就需要在用户端为模型和Agent提供足够详实、有用的信息,让它能理解“你是谁”“你正在做什么”“什么答案对你有价值”等核心问题,从而锚定正确路径。

在开发端,

围绕AI产品开发,也需要有充分的上下文沟通。

姚顺雨和汤道生在上述活动的对谈中提到,AI产品开发需要从产品反馈中去确定模型应该奖励什么、惩罚什么,什么回答算好,什么行为算差。这意味着,模型团队和产品团队需要通过一个上下文共享的过程,完成Co-Design,共同创造出更好的体验。

因此,AI产品在用户端要连接和积累多源的上下文信息,然后通过辨别哪些信息该给、哪些不该给,来与Agent对齐任务意图;在开发端则要建立顺畅的反馈机制,将模型团队与产品团队的开发目标对齐,加速体验优化。

无论是用户端上下文的积累,还是开发端上下文的共享

,都不只是开发问题,更是组织问题,需要通过协同来实现积累与共享。这也是为什么OpenAI为了整合ChatGPT和Codex,早在今年1月就开始重组团队,让产品团队和负责底层模型的研究人员更紧密协作,之后又将ChatGPT、Codex和API团队整合成一个部门。

同时,

对上下文的重视,可能还会刺激硬件的Agent化,让硬件成为Agent收集用户上下文的有效途径。

微软的Project Solara项目就是在进行这种探索。随时随地的沟通并不是开发Agent桌面终端和随身设备的唯一目的,更多是为了在桌面、移动场景中为Agent执行任务提供更多上下文信息。

过去几年,AI行业呈现出一条相对清晰的技术路径:预训练→后训练→Agent→Coding Agent。这条路径可能不是未来唯一的主线,但却是大厂当下能抓住的最有效的主线。而我们提炼出的四个趋势,正是这条路径上层层相连的基础坐标,最终都是为了实现Coding Agent向通用场景的泛化。

这又是一场系统级的竞争。

热门手游

相关攻略

手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc