来源:互联网 更新时间:2026-06-30 14:26
DeepMind团队刚放出个大新闻——他们把原生的计算机使用能力直接塞进了Gemini 3.5 Flash模型里。这意味着什么?开发者现在只需要一个模型,就能造出那种能在浏览器、手机或者电脑桌面上自己看屏幕、自己点按钮、自己操作的AI智能体。
要知道,以前这项能力是作为一个独立模型单独提供的,开发者得在不同模型之间来回切换、手动传递上下文,麻烦得很。现在原生集成之后,AI在执行跨平台的长任务时,再也不用人工传信息了,整个开发流程被大幅简化。
谷歌团队的核心判断是:AI智能体的瓶颈从来不在单个工具的极限,而在于多个工具切换时,上下文信息容易丢失。把搜索、地图和计算机操作统一到一个模型架构下,上下文就能连续流动,复杂任务中途挂掉的概率自然就降下来了。
这种“多工具合一”的设计,就像是直接盖一栋内部连通的综合大楼,省去了多栋独立建筑之间那些又长又容易出错的通信走廊。这种架构层面的调整,有望让袋里式任务的可靠性和响应延迟得到实质性改善。
这项原生能力主要瞄准三个核心场景:需要连续数小时甚至数天持续操作的自动化任务、自动验证界面一致性的持续性软件测试、以及跨应用的知识性工作。这些场景有个共同点——极度依赖多任务之间的上下文连续性,正好可以替代人类去干那些重复又耗神的操作。
安全方面,谷歌用了多层防御策略:包括针对性的对抗训练、针对敏感操作的企业级安全护栏,还有间接提示注入检测。面对开放且不可控的真实计算机环境,这些机制共同给企业用户搭起了一道相对完整的防护墙。
archiveofourown 实战指南:常见用法整理
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
电视剧《小欢喜》剧情介绍
如何在夸克浏览器中开启网页视频的倍速播放功能?
《梦幻西游》159五开五门怎么搭配-159五开五门常见搭配
美好的简约网名男生(精选100个)
植物娘大战僵尸电脑端与手机端存档转移的方法
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
腾讯元宝怎么用来分析股票基金的基本面信息?
盖乐世社区怎么删除帖子?盖乐世社区个人发布内容撤回步骤
wallpaper壁纸声音怎么开启
独家/李宰旭入伍前「登上孤岛服役」 惊见前辈裸体:忍不住笑了
国际贵金属走低,现货黄金价格跌0.49%
问题:CIA币好不?Cia Protocol币今日上线:价格预测、代币经济学和未来潜力
看韩漫的APP推荐 2026免费韩漫阅读软件大全
短剧《嫡女她是山大王》剧情介绍
OpenAI 调整手机端 ChatGPT,提示词可提前选 AI 响应档位
免费观看国外短视频的app有哪些 观看国外短视频的软件下载
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc