万益资讯网

小米大模型刷新全球最快推理速度与 iOS 27 的 AI 形成明确“反观”的是小

小米大模型刷新全球最快推理速度与 iOS 27 的 AI 形成明确“反观”的是小米 Mimo 大模型:

小米 MiMo 今日联合 TileRT 推出 Xiaomi MiMo-V2.5-Pro UltraSpeed 模式,依靠模型与系统的协同优化,该模式在通用 GPU 环境下,成功将万亿参数模型的生成速度首次突破 1000 tokens/s!

配套的 MiMo-V2.5-Pro-UltraSpeed API 也同步上线,其限时体验价格为原版 MiMo-V2.5-Pro 的 3 倍,输出速度却有约 10 倍的提升,该 API 仅支持 API 体验,并不支持 Token Plan。

原来的 AI Agent,写方案等吐词、改代码等吐词、干点活儿等吐词,主打一个疯狂转圈(甚至苹果发布会实机演示的 Siri AI 都这样);而这次小米这个万亿参数模型跑到1000 tokens/s,说明终于有人开始重视,并且认真解决“等待”这件事了。

小米这次提速的还是万亿参数模型。小模型跑得快大家见得多,大模型能力强但速度通常越慢,这几乎是行业共识。小米全新 Xiaomi MiMo-V2.5-Pro UltraSpeed 模式既保持大模型能力,又提升速度近 10 倍,背后就是小米大模型团队强大的系统工程能力