如果马斯克这次吹的牛X能够实现,Grok 大概能排在顶级模型天梯图的什么位置?
马斯克说 Grok 4.5 v9 架构(1.5T)训练完成,评估结果看起来不错。
这是啥意思?
现在的 Grok(4.3)运行在 v8-small 上,0.5T 参数,在 swe-bench 上得分 70.8%。
v9 参数是前代的 3 倍,还融入了 cursor 数据。
所以马斯克暗示的是从 70.8 直接跳到约 88,一举达到前沿水平,大概落在 opus 4.8 和 gpt-5.5 之间。
如果能够实现,Grok 将会重新回到最前沿模型的竞争行列。
而且这个模型将能同时出色运行研究和编码任务,这是历史上第一次。
