AIME’25满分炸场!Qwen一波七连发,全家桶大更新

469次阅读
没有评论

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

模型盛宴,还得看阿里

金磊 发自 凹非寺

量子位 | 公众号 QbitAI

它来了,它来了!

新一代旗舰模型Qwen3-Max带着满分成绩,正式地来了——

国产大模型首次在AIME25和HMMT这两个数学评测榜单拿下100分!

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

和前不久Qwen3-Max-Preview一致,参数量依旧是超万亿的规模。

但这次正式的发布在版本上有了一个划分:

  • 指令版(Instruct)
  • 思考版(Thinking)

而且Qwen3-Max在性能上也有了一定的提升(情商智商,双商增强)。

刚才我们提到的数学满分,正是思考版所拿下的成绩。

至于指令版,则是在SWE-Bench评测(大模型用coding解决真实世界问题)中斩获69.6分,位列全球第一梯队。

以及在Tau2 Bench测试(考察Agent工具调用能力)中,超过Claude Opus4和DeepSeek V3.1,拿下74.8分的成绩。

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

强,确实是有点强。

但有一说一,如果说Qwen3-Max是一把“火”,那么在刚刚的云栖大会上,通义团队还散出了很多的“星”。

视觉:Qwen3-VL重磅开源

从Qwen3-Max散出来的第一个“星”,就是视觉理解模型Qwen3-VL

其实它在今天凌晨的时候已经开源,属于“微鲜”出炉,但确实是大家比较期待的那一个。

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

具体而言,这次的型号叫做Qwen3-VL-235B-A22B,同样分为指令版推理版

其中,指令版本在多项主流视觉感知评测中,性能达到甚至超过Gemini 2.5 Pro;而推理版本则是在众多多模态推理的评测基准下取得了SOTA的表现。

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

除此之外,Qwen3-VL-235B-A22B指令版还支持在带图推理,并且在四项基准测试中的成绩均有所提升。

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

网友在看到成绩之后,甚至直呼:

Qwen3-VL真是个怪物(太强了)。

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

实际测试效果现在也已经放出来了。

例如把一张手绘的网页“喂”给Qwen3-VL,它就能唰唰唰地给出HTML和CSS:

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

再如给它下面这张图:

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

并让Qwen3-VL完成如下任务:

找出属于以下类别的所有实例:“头部、手部、男性、女性、眼镜”。请以JSON格式报告边界框坐标。

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

更复杂的视频理解,Qwen3-VL也是不在话下:

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

更多案例可以通过下面的视频了解一下:

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

视频地址:https://mp.weixin.qq.com/s/nkNXwpDxxvFVleQ3yB-g5w

技术层面来看,Qwen3-VL还是采用了原生动态分辨率设计,但在结构设计上进行了更新

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

一是采用MRoPE-Interleave。原始MRoPE按时间 (t)、高度 (h)、宽度 (w) 顺序划分,使时间信息集中在高频维度。Qwen3-VL改为t、h、w交错分布,实现全频覆盖,提升对长视频的理解,同时保持图像理解能力。

二是引入DeepStack,融合ViT多层特征,增强视觉细节捕捉和图文对齐。

团队将视觉tokens的单层注入扩展为LLM多层注入,并优化特征token化:对ViT不同层输出分别token化并输入模型,从而保留从低层到高层的多层次视觉信息。实验表明,该设计显著提升了多种视觉理解任务的表现。

三是将视频时序建模由T-RoPE升级为 文本时间戳对齐机制。通过“时间戳-视频帧”交错输入,实现帧级时间与视觉内容的精细对齐,并原生支持“秒数”和“HMS”两种输出。如此一来,便改进提升了模型在事件定位、动作边界检测、跨模态时间问答等复杂时序任务中的语义感知与时间精度。

全模态:Qwen3-Omni开源

Qwen3-Omni虽然是昨天凌晨已经开源,但在这次云栖大会中也是一同亮相,主打的就是一个全模态

它是首个原生端到端全模态人工智能模型,在一个模型中统一了文本、图像、音频和视频,并且在22个音视频基准测试中达到了SOTA的水平。

目前已经开源的版本包括:

  • Qwen3-Omni-30B-A3B-Instruct
  • Qwen3-Omni-30B-A3B-Thinking
  • Qwen3-Omni-30B-A3B-Captioner

不过基于Qwen3-Omni还衍生出了更多好玩且强悍的细分大模型。

例如今天发布的Qwen3-LiveTranslate就是其中一个——视、听、说全模态同传大模型!

目前,它已经实现了覆盖18种语言的离线和实时两种音视频翻译能力。

从公开测试的成绩来看,Qwen3-LiveTranslate-Flash的准确率已经超过了Gemini-2.5-Flash、GPT-4o-Audio-Preview等:

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

即便是在环境嘈杂的地方,Qwen3-LiveTranslate-Flash依旧是能hold得住:

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

至于具体效果,来感受一下具体实操的效果:

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

视频地址:https://mp.weixin.qq.com/s/nkNXwpDxxvFVleQ3yB-g5w

英文原文:What is mask? This is mask. This is mask. This is mask. This is Musk.

视觉增强前:什么是口罩?这是口罩,这是口罩,这是口罩,这是口罩。

视觉增强后:什么是口罩?这是面膜,这是口罩,这是面具,这是马斯克。

网友看罢,也是有亿点点震惊在身上的:

我都觉得有点恐怖了。

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

除了翻译之外,Qwen版Banana——Qwen3-Image-Edit的新版本,也是非常有趣的一个模型。

不仅支持多图融合,提供“人物+人物”,“人物+商品”,“人物+场景” 等多种玩法,还增强了人物、商品、文字等单图一致性。

而且它还原生支持ControlNet,可通过关键点图改变人物姿势,还可轻松实现换装需求。

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

编程:Qwen3-Coder升级

新升级的Qwen3-Coder-Plus玩了一套“组合拳”:Qwen Code、Claude Code系统联合训练。

如此打法之下,它的性能效果得到了显著的提升;可以看到相较于之前的版本,在各项基准测试中的分数都有所增长:

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

与此同时,与之相关的编程产品Qwen Code也有了升级动作,增加了对多模态模型和sub-agent的支持。

换言之,你现在用Qwen Code的时候,可以输入图像了:

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

然后已经有网友开始在实测了,Qwen3-Coder-Plus打造的一座3D宝塔效果是这样的:

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

Qwen的终点,不只是开源

最后,总结一下这次云栖大会中的亮点。

首先就是从前天至今,阿里通义千问已经陆陆续续发布、开源大大小小近十款模型,已经是让国内外业界人士对阿里云的开源速度叹为观止。

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

但有一说一,在听完阿里云智能集团董事长兼CEO吴泳铭的演讲之后,我们发现,通义千问要做的事情,远不止于此。

因为吴泳铭表示,实现AGI已然是确定性事件,但这还仅是起点,终极目标是发展出能自我迭代、全面超越人类的超级人工智能(ASI)。

而要实现ASI,则需要以互联网为起点,经历四个阶段:

第一阶段是智能涌现(学习人)、其次是自主行动(辅助人)、接下来是自我迭代(超越人),最后就是超级人工智能(ASI)。

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

除此之外,吴泳铭还非常有远见地认为:

大模型将是下一代操作系统,自然语言是以后的源代码,AI Cloud是下一代计算机

未来全世界或只会有5-6个超级云计算平台。

AIME’25满分炸场!Qwen一波七连发,全家桶大更新

但需要明确的一点是,AI越强,人类越强。

One More Thing

哦对了,通义千问那个新一代基础模型架构——Qwen3-Next,今天也正式发布了!

它的模型总参数量大约是80B,但实际上,仅仅在激活3B的情况下,它的性能就可以跟Qwen3-235B媲美。

计算效率,可以说是直接Pro Max了~

而且与密集模型Qwen3-32B相比,它的训练成本降低了超90%,长文本推理吞吐量提升超过10倍。

不得不说,未来大模型的训练和推理效率,要变得更加有意思了。

参考链接:
https://qwen.ai/research

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 9 月
1234567
891011121314
15161718192021
22232425262728
2930  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了 衡宇 2025-12-10 12:3...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案 十三 2025-12-10 1...
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局 量子位的朋友们 2025-12-10 18:...
乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头 梦瑶 2025-12-10 20:41:15 来源:量子位 梦瑶 发自 ...