来源:互联网 更新时间:2026-05-29 15:32
2026年5月29日,阶跃星辰发布了新一代的高效率Flash模型——Step 3.7 Flash。如果说之前的模型更像是问答之间的单向交流,那么这一次,Step 3.7 Flash的重点显然放在了“理解之后去执行”这件事上。它不再满足于给出答案,而是围绕多模态感知、网页与视觉搜索、工具调用、代码执行和完整的Agent工作流,做了一套相当系统的升级。
从技术架构上看,Step 3.7 Flash采用的是稀疏MoE视觉语言模型设计,文本、图像、代码、搜索和工具调用都集成在一起。官方信息显示,它能理解产品界面、文档、图表以及各种自然场景的视觉输入,然后基于看到的内容生成代码或调用工具来完成任务。对于AI Agent来说,这意味着模型不再是“纸上谈兵”——它可以在浏览器里操作页面、在终端执行命令、和Office工具打交道、利用搜索工具不断获取反馈,然后根据结果迭代下一步行动。
编程能力是这次升级的重头戏。Step 3.7 Flash针对Agentic Coding场景做了专门优化,覆盖代码生成、Bug修复、多文件项目理解、终端操作以及自动化开发任务。数据也能说明问题:相比上代Step 3.5 Flash,新版本在SWE-Bench Pro和Terminal-Bench 2.1等编码评测中都有明显提升,而且在多个主流Agent框架上的表现更加均衡,不再会出现“偏科”的情况。
搜索能力的强化也值得一提。模型在搜索规划、证据筛选和信息综合这些环节上有了实质性改进,可以应对更复杂的网页搜索、视觉搜索以及跨来源信息的整合。如果用户的任务涉及实时信息获取、长尾实体识别、资料核验或者深度研究,Step 3.7 Flash更像一个会主动检索、筛选和整理信息的助手,而不是被动等待关键词匹配的搜索引擎。
在企业级应用方面,Step 3.7 Flash对文档、表格、截图、业务资料和专业知识类工作同样做了针对性优化。它能处理混合输入,结合搜索、工具调用和视觉理解,完成步骤更长的任务链条。从企业报告分析、数据整理,到财务会计辅助、制造工程任务,再到办公自动化和多工具协作,都派得上用场。
生态兼容性也是Step 3.7 Flash考虑的重点。它支持Claude Code、KiloCode、Hermes Agent、OpenClaw等主流Agent框架和Skills,开发者可以相对轻松地将它接入现有工作流。在部署上,既可以通过阶跃星辰开放平台直接调用,也能在Web端和App中体验,同时支持OpenRouter、NVIDIA NIM等合作平台。对于企业团队来说,云端、数据中心或本地高内存设备都能部署,灵活度足够应对不同规模的需求。
整体来看,Step 3.7 Flash的发布不只是简单的版本迭代,更像是阶跃星辰把Flash模型推向真实Agent应用的一次关键尝试。它在多模态理解、搜索增强、工具调用、智能编程和本地部署这几个维度上,建立了一套较为完整的能力组合。对于正在构建AI Agent、企业自动化工具或者多模态应用的开发者来说,这款国产高效率模型确实值得认真关注。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
免费影视剧APP推荐
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
抖音最火沙雕男生网名(精选100个)
网络热词聊污是什么意思
蒙古上单是什么梗
帅气继父网名女生可爱英文(精选100个)
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
免费看片软件下载地址推荐
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
免费看电影的软件推荐
韦一敏是什么梗
三角洲行动卡战备怎么弄 三角洲行动卡战备攻略
晨字沙雕网名大全女生(精选100个)
帅到极致的网名女生霸气(精选100个)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc