Qwen半成品刷下AIME25满分Qwen预览版数学推理SOTA半成品模型,已经

量子位看科技 2025-11-04 15:17:09

Qwen半成品刷下AIME25满分Qwen预览版数学推理SOTA

半成品模型,已经刷下高难度数学推理测试AIME 25满分战绩。

开源之王Qwen又在深夜放大招了。【图1】

Qwen3"超大杯"推理版露出庐山真面目,虽然还是"早期预览版",仍在训练中,但在当前的Checkpoint,已经能在AIME 25和HMMT25(哈佛-MIT数学竞赛)中达到100%的准确率。

什么概念?就是一整个全场看呆的节奏:【图2】

此前,AIME 25的最好成绩由GPT-5系列把持,GPT-5 Codex(high)的准确率是98.7%,GPT-5(high)是94.3%。而Qwen3 235B的成绩是91%。【图3】

这不Ilya和奥特曼还在为当年的"真还传"扯头花嘛,有网友感叹:

这个完成度令人难以置信。OpenAI还在搞抓马,而Qwen已经默默耕耘惊艳众人。【图4】

目前,这个Qwen3-Max-Thinking的早期预览版已经可以在Qwen Chat中免费试用,API也已上线阿里云。官方承诺,训练还在继续,后续会持续更新版本。【图5】

[图片]

0 阅读:0
量子位看科技

量子位看科技

感谢大家的关注