来源:互联网 更新时间:2026-04-13 18:34
11月26日消息,今日,空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列头两名,超越Gemini 3、GPT-5.1、Claude Sonnet4.5等国际顶尖模型。
SpatialBench榜单显示,Qwen3-VL-235B和Qwen2.5-VL-72B分别斩获13.5和12.9分,领先于Gemini 3.0 Pro Preview(9.6) 、GPT-5.1(7.5)、Claude Sonnet 4.5等海外顶尖模型。

然而,AI大模型的整体表现距离人类仍有差距,人类基准线约为80分左右,可专业处理电路分析、CAD 工程和分子生物学等复杂空间推理任务,目前大模型还无法完全自动化完成此类工作。
据悉,Qwen2.5-VL于2024年开源,Qwen3-VL是阿里在2025年开源的新一代视觉理解模型。
Qwen3-VL在视觉感知和多模态推理方面实现重大突破,在32项核心能力测评中超过Gemini2.5-Pro和GPT-5,不但可调用抠图、搜索等工具完成“带图推理”,也可以凭借一张设计草图或一段小游戏视频直接“视觉编程”。

同时,Qwen3-VL专门增强了3D检测能力,可以更好地感知空间,基于Qwen3-VL,机器人更好地判断物体方位、视角变化和遮挡关系,实现远处苹果的精准抓取。
目前,Qwen3-VL已开源不同版本,包括2B、4B、8B、32B等密集模型以及30B-A3B、235B-A22B等MoE模型,每个模型都有指令版和推理版两款,是当下最受企业和开发者欢迎的开源视觉理解模型。同时,Qwen3-VL模型也已上线千问APP,用户可免费体验。
据了解,SpatialBench是一项近年来兴起的第三方空间推理基准测试榜单,主要聚焦多模态模型在空间、结构、路径等方面的综合推理能力,被AI社区视为是衡量“具身智能”进展的新兴测试标准之一。
SpatialBench不仅测试模型已知的知识,还测试模型在二维和三维空间中“感知”和操控抽象概念的能力,这对具身智能的落地尤为关键。
本文标签: #阿里AI #阿里Qwen3
洛克王国世界雪影娃娃捕捉攻略 洛克王国世界雪影娃娃怎么捕捉
《洛克王国 世界》开服必看 抢先入手16只完美精灵 开局就赢在起跑线
牛奶价格卷起来了:多家品牌搞促销
于东来回应退休:只是表面退休了 实际还是不退
洛克王国世界伊利斯怎么打
儿子去世 名下房产被判全归养母:生母缺席成长 养母照顾长大
起猛了 在成都看到关公开公交:三国寻梦线巴士正式推出
能穿地的 “Wi-Fi” 无线网络成功了!可深入地表下100米 有望集成到手机中
龙胤立志传铸剑山庄门派有什么特点
守塔不能停官网首页入口
张雪峰追悼会将在明日举行 生前曾有三次自救机会 都被他错过了
Token经济已来 京东云Coding Plan上线
斗熊舞是我国哪个民族的传统舞蹈
QQ经典农场快速冲级攻略
龙胤立志传江湖绝世武学什么效果
洛克王国世界可可果商店兑换哪些
洛克王国世界烈火战神超进化条件是什么
超自然行动组如何快速找到棺材 超自然行动组棺材位置一览
保卫向日葵什么阵容强 保卫向日葵强力阵容免费获取攻略
《怪猎》险些被砍 日本业界现状 入行十年一无所获
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc