Qwen半成品刷下AIME25满分Qwen预览版数学推理SOTA半成品模型，已经

量子位看科技 2025-11-04 15:17:09

Qwen半成品刷下AIME25满分Qwen预览版数学推理SOTA

半成品模型，已经刷下高难度数学推理测试AIME 25满分战绩。

开源之王Qwen又在深夜放大招了。【图1】

Qwen3"超大杯"推理版露出庐山真面目，虽然还是"早期预览版"，仍在训练中，但在当前的Checkpoint，已经能在AIME 25和HMMT25（哈佛-MIT数学竞赛）中达到100%的准确率。

什么概念？就是一整个全场看呆的节奏：【图2】

此前，AIME 25的最好成绩由GPT-5系列把持，GPT-5 Codex（high）的准确率是98.7%，GPT-5（high）是94.3%。而Qwen3 235B的成绩是91%。【图3】

这不Ilya和奥特曼还在为当年的"真还传"扯头花嘛，有网友感叹：

这个完成度令人难以置信。OpenAI还在搞抓马，而Qwen已经默默耕耘惊艳众人。【图4】

目前，这个Qwen3-Max-Thinking的早期预览版已经可以在Qwen Chat中免费试用，API也已上线阿里云。官方承诺，训练还在继续，后续会持续更新版本。【图5】

[图片]

0 阅读：0

量子位看科技

感谢大家的关注

作者最新文章

1

一键生成Paper草稿自动写Paper智能体Denario：可视化科研写作平台，

2

全球首个AI投资大赛落幕AI投资大赛阿里Qwen夺冠历时17天，AI圈最“上头”

3

MiniMax实习生炼成屠榜模型屠榜开源榜MiniMaxM2技术解析屠榜开源大模

4

聚焦手机AI超级入口中兴小模型让手机变小秘手机上的AI“超级入口”，真的来了。

5

Qwen半成品刷下AIME25满分Qwen预览版数学推理SOTA半成品模型，已经

6

OpenAI宫斗真相全曝光52页证词撕开硅谷宫斗最新披露的llya 52页证词，

7

AI正取代哪些岗位这些岗位正受AI影响2025年，全球招聘数量同比下降了8%，A

8

AI编程提示词Top20常用VibeCoding提示词😂要说最热门的编程语言，

9

OpenAI给AWS甩380亿算力订单OpenAI与亚马逊达成云合作OpenAI

10

马斯克奥特曼再开撕硅谷甄嬛传更新精彩，实在是精彩！硅谷"甄嬛传"——马斯克和奥特

热门分类

科技TOP

1

这是做什么工作的？电脑上也看不懂

2

科技发展真是越来越离谱啦！近日，浙江温州街头，一个人形机器人稳稳牵着机器狗遛弯，

3

华为官宣鸿蒙操作系统610月22日特别发布，官宣更好看，更好用，更智能，更安

4

华为Mate80会在2025年11月发布，大家最关心的是它用的芯片，麒麟9030

5

陈奕迅将现身K90发布会今晚陈奕迅会携新版《K歌之王》空降K90系列发布会现场，

6

估计不止刘强东和雷军就连马云也发懵了于东来最近这是怎么了，他竟然又说50万元3小

7

华为Mate70Pro在某多多上面百亿补贴的价格才四千多？敢不敢买？看上m

8

HarmonyOS6来了，10月22日14:30，鸿蒙操作系统6

9

今年mate80是不是还是走mate70路线，11月发布，前期缺货，过几个月供应

10

我发誓，我的Mate60Pro还没捂热乎呢，Mate80的消息就直接要上王

科技最新文章

1

【曝华为Mate80系列Pro版备货较少主推标准版和Pro+】有数码博主爆料

2

华为Mate80系列将于11.8号发布，满屏黑科技直接把期待值拉满！新一代麒

3

预售相当火爆，华为线下门店已开启Mate系列新机线下预订服务，目前，不少门店

4

科技发展真是越来越离谱啦！近日，浙江温州街头，一个人形机器人稳稳牵着机器狗遛弯，

5

【小米双11全渠道累计支付金额破182亿】11月1日，小米公司宣布，截至2025

6

这么来讲，华为新品与鸿蒙星光盛典之间只差10天左右。已知华为Mate80系列

7

荣耀目前最建议买的4款手机1、荣耀X70内置8300mAh超大电池，适合人群是

8

俄罗斯为什么不担心芯片制造和光刻机的问题？就这么说吧，除了中国，其他国家都不担心

9

把华为Pura80Pro换成荣耀Magic8Pro，是什么感受？朋友是个老

10

即将开启11月中端影像机大战！OPPO、vivo、荣耀两亿像素普及！！三款