万益资讯网

很多人问我MiniMax价格的事儿,我说两句 | MiniMax 今天发了 M3

很多人问我MiniMax价格的事儿,我说两句 | MiniMax 今天发了 M3,你刷到了吧。我直接说重点:

这是国产模型里,第一个同时集齐三样的开源模型:编程能力达到最顶尖那一档、100 万上下文窗口、以及原生多模态。

在这之前,能把这三样同时做到的只有 Opus 4.8、Gemini 3.1 和 GPT 5.5,它们全都是闭源的,实测下来的感受是,它超过了 Sonnet 4.6。

Sonnet 4.6 是现在全球开发者用得比较多的模型之一,写代码、跑 Agent、处理文档,大部分人吃的就是这碗饭,M3已经到了能上生产环境的水平。

100 万上下文窗口意味着什么?

一次性吃下一整个项目的代码库,连带文档、测试用例、历史记录一起读进去,边读边改。

我研究了下背后的技术:

MiniMax自研了一个叫MSA的稀疏注意力架构,100 万 token 上下文的计算量只有上一代模型的二十分之一,推理时,模型理解问题的阶段快了 9 倍,生成答案的阶段快了 15 倍。

说白了,100 万上下文以前谁都能做,就是算不起这笔账,MSA 把成本打下来了。

看了几个例子:

一个是让 M3 去优化 CUDA 算子,24 小时跑了 147 次提交,把性能从 cuBLAS 基准的 7.6% 拉到了 71.3%,全程自主迭代。

另一个是拿一篇 ICLR 获奖论文扔给它,12 小时独立复现,跑通训练流程出结果;这些场景是真正的工程活,能干这种活的模型,全球数得过来。

MiniMax还同步发了 MiniMax Code,一个编程 Agent 工具,对标 Claude Code 和 Codex。这个工具跟 M3 一起训练出来的,模型加工具一起上,卖一套完整的开发者工作流。

另外,M3 是即将开源的。对很多中大型公司来说,这是排在能力前面的硬门槛;能力到了,价格低了,还开源,三样凑齐,企业才真的会从闭源切过来。
再来说价格。我算了笔账。

MiniMax 这次同步更新了 Token Plan,分三档。

每个月 49 块,给 6 亿 token;对比一下,Claude Pro一个月 145 块,量只有 MiniMax五分之一。

每个月119块,给18亿 token;Claude Max 5x 一个月 730 块,量只有 MiniMax 的一半,价格贵了 6 倍。

每个月469块,给 55 亿 token;对标 Claude Max 20x套餐,量还多出 3 倍。同价位拉平算,MiniMax 给的量大概是 Claude 的 15 倍。

别人把前沿能力当高端品卖,MiniMax选择把门槛降到最低,让更多开发者用上。

我认为,模型层战争不会停,各家还会继续卷能力。MiniMax M3 押的是另一个逻辑:用顶级能力配上普惠定价,先把开发者生态用起来。