小米大模型，AI领域又出新招。小米AI团队发论文了，北大也参与了，用了MoE和

灵巧光束 2025-10-21 18:03:28

小米大模型，AI领域又出新招。小米AI团队发论文了，北大也参与了，用了MoE和强化学习，好像很厉害的样子，是罗福莉搞的，听说之前在深势科技。罗福莉本科是北师大的，硕士在北大，师从穗志方，后来去了阿里达摩院，参与AliceMind，还去了幻方量化DeepSeek，搞DeepSeek V2，2024年9月，DeepSeek发论文的时候，她署名“北京独立研究者”，大家都在猜，这是什么情况，现在发的小米论文，她是通讯作者之一，可能已经去小米了吧，之前的“独立研究者”，也许只是过渡。他们搞了个R3方法，说是能解决MoE架构大模型强化学习的问题，MoE架构训练不稳定，还容易崩溃，推理和训练不一样，导致“概率漂移”，R3就是锁定路由，推理的时候记录路由，训练的时候重放，让训练和推理一样，还用了路由掩码，缓存路由信息，避免重复计算，这样就能更稳定更高效。他们用Qwen3-30B-A3B做实验，R3表现更好，和GSPO结合更厉害，训练曲线更平稳，不容易崩，优化过程也更流畅，能更快找到正确的方向，R3方法能让MoE模型更稳定，更高效。第一作者是温涵，小米LLM-Core团队的实习生，参与了MiMo模型，通讯作者是罗福莉和穗志方，小米和北大合作，说不定以后能搞出更多好东西，罗福莉的单位标注有点奇怪，但她确实很厉害，小米在大模型领域，肯定要搞大事。

0 阅读：0

感谢大家的关注

作者最新文章

1

中美贸易迷局，大豆芬太尼稀土的谈判暗涌起因是稀土出口管制，确实管得严了，美国那

2

“我是中国人”狂潮：郑丽文当选背后的台湾深蓝涌动主席选举结果出了，郑丽文赢了，

3

高铁托运行李,是方便还是花钱, 一开始在几个大站试点,2024年6月,好像是19

4

OPPO三十年，有点难， 2025年，Find X9很重要，高端转型啊。绿线门来

5

苹果2025双11，iPhone 17 Pro降价大揭秘苹果天猫店，要搞双11

6

赚中国千亿还捅刀？时隔8个月，澳军机闯南海，被解放军上了一课事情是这样的，20

7

石破内阁落幕，高市早苗时代要来了？当地时间21日上午，石破内阁辞职了，集体辞职

8

一字值万金！广东一“00后”对出莫言上联，获10万元奖金 2024年6月，莫言去

9

特朗普空军一号风波：印度石油罗生门特朗普在空军一号上，又发话了，说印度的事儿。

10

郑丽文：当然要赴大陆交流，怕就不要出来混今天她接受采访了，王浅秋主持的节目，郑

热门分类

国际TOP

1

这个时间点偷偷摸摸的去韩国，还全程戒备全副武装，前段时间戴上了牙套，真的是很微妙

2

100台光刻机，数百亿欧元级生意！美国突然变脸荷兰：我们成“炮灰”了2

3

在日本打工的朋友回来了，很多年没见，昨天一起吃个饭，我问他：日本那边怕打仗吗？他

4

以后坐飞机，可能真的要站着了。不是开玩笑。欧洲那个最大的廉价航空，叫瑞安的

5

中法会谈刚落幕！马克龙离开人民大会堂时的一番表态，直接让东京的高市早苗政府

6

要是中日真的撕破脸开战，两边到底谁能争取到更多国家出手相助？美国有智库早就给出了

7

和日本媒体打交道真是防不胜防，不握手才是对的

8

奇瑞展台好多中东人，头顶一块布，全球我最富，最富的人看奇瑞

9

日本通告，如果中国不让步，就驱逐外交官，话音刚落空军王炸来了，日本这次的通告来得

10

中国不敢打？认怂了？很多人以为面对高市早苗的骑脸挑衅，中国只是在打嘴炮，错了！真

国际最新文章

1

泰国捅了马蜂窝，柬埔寨5000枚火箭弹，已经倾泻到泰国边境，炸毁一批阵地！1

2

快报！快报日本突然宣布了12月8日消息，日本前首相鸠山由纪夫于7日接受总台

3

中国现在之所以不和日本打，不是因为中国自己太软弱，也不是为了和平想放过日本，更不

4

高市早苗就日本自卫队军机遭雷达照射谨慎发言！12月7日下午，日本首相高市早苗在

5

中日战机对峙，不到12小时，中俄官宣大行动，普京终于下定了决心。这个周末，中日局

6

炸锅了炸锅了日本共同社12月6日报道日本首相高市早苗及其内阁成员个人资产

7

美国要变天了！12月05日，刚从中国回来的马克龙，立马翻脸不认账。他急匆匆站

8

中法会谈刚落幕！马克龙离开人民大会堂时的一番表态，直接让东京的高市早苗政府

9

中国不敢打？认怂了？很多人以为面对高市早苗的骑脸挑衅，中国只是在打嘴炮，错了！真

10

中国现在之所以不和日本打，不是因为中国自己太软弱，也不是为了和平想放过日本，更不