来源:互联网 更新时间:2026-06-03 17:09
阿里云通义千问大模型家族最近又有了新动静。两款全新的预览版模型——Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview,已经悄然登陆大模型竞技场Arena AI以及官方的Qwen Chat平台。这通常意味着,在接下来即将举办的阿里云峰会上,我们很可能会看到它们的正式亮相。
根据目前公开的产品信息,这次上线的预览版主打一个“纯粹”。它们暂时只开放了“思考模式”,换句话说,就是把所有算力都集中在了攻克高难度的逻辑推理和深度计算任务上。至于大家熟悉的网页搜索、代码解释器等辅助工具,在这一阶段还不会开放使用。这种“单点突破”的策略,显然是为了在最核心的智能基准上接受最严苛的检验。
那么,检验结果如何?用“惊艳”来形容并不为过。在衡量大模型综合文本能力的权威基准测试中,Qwen3.7 Max Preview的全球综合排名已经冲到了第13位。这个成绩直接带动阿里通义千问的实验室整体排名,一举进入了全球前六的阵营。
光有综合排名还不够,在真正体现技术硬实力的细分领域,这款模型的表现更具说服力。数据显示,它在数学能力榜单上高居全球第7。此外,在专家级应用、软件与IT、以及纯编程能力这几个关键的技术子榜单上,它也都稳稳地占据了全球前十的位置。这足以说明,其能力结构不仅全面,而且在需要深度思考和专业知识的领域尤为突出。
文本和逻辑推理能力强,是不是就“偏科”了?另一款同步亮相的Qwen3.7 Plus Preview给出了答案。这款高性能模型在视觉能力基准测试中,综合排名位列全球第16。正是凭借它在视觉领域的优异表现,通义千问在视觉榜单的实验室总排名也随之跃升至全球第5。
更有意思的是,在一个专门模拟高难度、复杂指令执行的“专家竞技场”测试中,Qwen3.7 Max Preview再次证明了其解决棘手问题的能力,排名稳定在全球第9。这一系列从综合到细分、从文本到多模态的硬核成绩,清晰地传递出一个信号:阿里云在大模型,尤其是在多模态和深度垂直应用的技术攻坚上,已经具备了全球一线的竞争力。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
帅气继父网名女生可爱英文(精选100个)
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
帅到极致的网名女生霸气(精选100个)
如何在夸克浏览器中开启网页视频的倍速播放功能?
蒙古上单是什么梗
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
作家助手如何上传自制封面 作家助手如何设置小说的封面
archiveofourown 实战指南:常见用法整理
韦一敏是什么梗
韩漫小少爷网名大全女生(精选100个)
网络热词聊污是什么意思
抖音最火沙雕男生网名(精选100个)
有寓意的易经网名男生(精选100个)
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
小众游戏抖音网名男生(精选100个)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc