Qwen半成品刷下AIME25满分Qwen预览版数学推理SOTA
半成品模型,已经刷下高难度数学推理测试AIME 25满分战绩。
开源之王Qwen又在深夜放大招了。【图1】
Qwen3"超大杯"推理版露出庐山真面目,虽然还是"早期预览版",仍在训练中,但在当前的Checkpoint,已经能在AIME 25和HMMT25(哈佛-MIT数学竞赛)中达到100%的准确率。
什么概念?就是一整个全场看呆的节奏:【图2】
此前,AIME 25的最好成绩由GPT-5系列把持,GPT-5 Codex(high)的准确率是98.7%,GPT-5(high)是94.3%。而Qwen3 235B的成绩是91%。【图3】
这不Ilya和奥特曼还在为当年的"真还传"扯头花嘛,有网友感叹:
这个完成度令人难以置信。OpenAI还在搞抓马,而Qwen已经默默耕耘惊艳众人。【图4】
目前,这个Qwen3-Max-Thinking的早期预览版已经可以在Qwen Chat中免费试用,API也已上线阿里云。官方承诺,训练还在继续,后续会持续更新版本。【图5】
[图片]




