来源:互联网 更新时间:2026-05-23 11:55

2026年5月22日,阿里巴巴正式发布了新一代旗舰大模型——Qwen3.7-Max。这意味着,无论是手机上的千问App、电脑上的客户端,还是网页版,现在都能直接体验到这款最新的模型了。
操作起来很简单:将千问App更新到6.9.7或更高版本,在界面底部就能找到“Qwen3.7-Max”的快捷入口,点一下就能用。在电脑端或网页上,只需要在对话窗口顶部的模型选择栏里下拉切换一下,就能立刻启用。最关键的是,这次升级对所有用户免费开放。
那么,这款新模型实力究竟如何?根据国际权威评测机构Artificial Analysis最新发布的全球大模型综合排名,Qwen3.7-Max以56.6分的成绩,位列全球第五,同时也是国产大模型中的第一名。这个位置,足以说明它已经稳稳站在了全球第一梯队。
当然,综合排名只是一个维度。要真正了解一个模型的实力,还得看它在具体任务上的“硬功夫”。
对于开发者而言,模型的编程能力至关重要。Qwen3.7-Max在SWE-Pro和SWE-Multilingual等专业编程测评中表现突出。更值得一提的是,在Terminal Bench 2.0-Terminus这项测试中,它拿到了69.7分,这个成绩已经超越了DeepSeek-v4-pro-Max、Claude-Opus4.6等一众主流竞争对手。
如果说编程是“纸上谈兵”,那么通用智能体能力考验的就是“真枪实弹”的任务执行水平。Qwen3.7-Max在这方面实现了显著跃升。在MCP-Atlas、MCP-Mark以及Skillbench等聚焦实际任务执行能力的权威评测中,它都取得了优异成绩。
整体来看,其通用智能体水平已经超过了GLM5.1、Kimi-K2.6等国内领先模型,刷新了国产大模型在现实场景应用能力上的纪录。此外,它在Kernel Bench L3测试中展现出的卓越GPU内核级优化能力,也为其高效处理复杂任务提供了底层支撑。
处理复杂问题,离不开强大的推理能力。在GPQA Diamond、HLE、HMMT 2026年2月版以及IMOAnswerBench等多项核心推理基准测试中,Qwen3.7-Max的表现全面超越了Claude-Opus4.6,同时也超越了所有已公开的国产模型。这标志着其在深度逻辑分析和解决复杂问题方面,已经达到了国际顶尖水准。
最后,作为大模型的基础核心能力,语言理解同样关键。Qwen3.7-Max在衡量指令遵循能力的IFBench评测中,得分高达79.1分,创下了历史新高。同时,在WMT24++与MAXIFE等多语言理解与翻译的权威测评中,它也位居前列。这意味着,无论是理解用户的复杂意图,还是处理跨语言的信息,它都能提供相当可靠的支持。
总的来看,Qwen3.7-Max的发布,不仅是阿里巴巴在技术上的又一次重要迭代,更是在全球大模型竞技场上,为国产模型树立了一个新的标杆。从编程到通用任务,从复杂推理到多语言理解,其全面而均衡的顶级表现,确实值得期待它在实际应用中的表现。
下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
初中英语同步课文跟读APP推荐|免费下载高口碑跟读软件排行榜
4D采矿者官网在哪下载 最新官方下载安装地址
阅读app安卓版下载推荐
BuuPo官网在哪下载 最新官方下载安装地址
碎片人偶Vragmeet官网在哪下载 最新官方下载安装地址
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
喧哗番长乙女 2nd Rumble !!官网在哪下载 最新官方下载安装地址
纸嫁衣9官网在哪下载 最新官方下载安装地址
好用的手环阅读app下载安装
无尽花界时装合辑
萌神契约手游下载安装
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
人声接近真人!OpenAI一口气更新三款超强语音AI
史莱姆大魔王2官网在哪下载 最新官方下载安装地址
苹果macOS 27将优化界面设计并测试AI驱动的Safari标签页自动分组功能
《英雄无敌3》不能在塔楼里城市里招募单位介绍
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc