来源:互联网 更新时间:2026-06-30 14:26
谷歌今天搞了个大动作——其人工智能生态系统迎来一次关键升级,原本处于测试阶段的“计算机使用”工具,现在被直接内置到了Gemini 3.5 Flash模型当中,不再依赖之前的2.5测试框架。这意味着什么?说白了,AI正在从一个只会聊天的“对话选手”,变成一个能真正帮你干活儿的“数字同事”。AI袋里(Agent)这个概念,之前总感觉是PPT上的愿景,现在算是正式上路了。
对于开发者来说,通过Gemini API就能直接调用3.5 Flash的原生能力去搭建智能袋里。这些袋里不像过去那样需要写一堆底层代码,它们的工作方式更像普通人类——通过看截图、理解画面上的视觉元素,直接可视化地去操作应用程序,从而自动执行各种复杂的桌面任务。这听起来是不是有点“科幻照进现实”的味道?
想想看,办公自动化、软件测试、跨平台数据整理,这些场景现在有了全新的解法。比如自动化浏览网页、填那些烦人的长表格、点击按钮,或者在桌面、移动端、浏览器环境里反复收集数据——这些重复性很高的工作,以后都可以交给AI去跑。为了让大家尽快上手,谷歌还在Browserbase上开放了实时演示空间,开发者可以直接去体验Gemini企业袋里平台的功能。

当然,把鼠标和键盘的控制权交给AI,安全问题肯定是绕不开的坎,尤其是间接指令注入这类风险。谷歌对此也做了准备,专门进行了针对性的对抗训练来强化模型的防御能力。与此同时,还同步推出了两款企业级安全系统:一个允许企业设置规则,要求AI在执行敏感或永久性更改操作之前,必须拿到人工的明确批准;另一个则能在检测到潜在攻击时,立即自动冻结正在运行的任务。这套组合拳,算是给桌面安全上了双保险。
配合这次模型升级,谷歌同日还发布了Chrome 149稳定版,里面新增了一个叫“从屏幕中选择”的功能。用户在浏览器的附件菜单里开启后,可以直接框选当前标签页中的图像或文本,瞬间就能把它们作为提示语丢给Gemini。对于经常需要基于网页内容提问的人来说,这个交互体验的提升相当直观。
把原生计算机使用工具集成到Gemini 3.5 Flash里,这一步棋的背后,折射出AI行业一个更值得关注的变化:大家不再一味追求把模型参数堆到极致,而是开始拼实际的工具使用和任务执行能力。这条路径一旦跑通,AI袋里在企业自动化和消费者场景中的普及速度会大大加快,人机交互和软件应用的形态也会被重新定义——更高级别的自主AI袋里,不再只是可能性,而是正在变成现实。
archiveofourown 实战指南:常见用法整理
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
电视剧《小欢喜》剧情介绍
如何在夸克浏览器中开启网页视频的倍速播放功能?
《梦幻西游》159五开五门怎么搭配-159五开五门常见搭配
美好的简约网名男生(精选100个)
植物娘大战僵尸电脑端与手机端存档转移的方法
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
腾讯元宝怎么用来分析股票基金的基本面信息?
盖乐世社区怎么删除帖子?盖乐世社区个人发布内容撤回步骤
wallpaper壁纸声音怎么开启
独家/李宰旭入伍前「登上孤岛服役」 惊见前辈裸体:忍不住笑了
国际贵金属走低,现货黄金价格跌0.49%
问题:CIA币好不?Cia Protocol币今日上线:价格预测、代币经济学和未来潜力
看韩漫的APP推荐 2026免费韩漫阅读软件大全
短剧《嫡女她是山大王》剧情介绍
OpenAI 调整手机端 ChatGPT,提示词可提前选 AI 响应档位
免费观看国外短视频的app有哪些 观看国外短视频的软件下载
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc