那摆在面前很现实的情况就是，东大已经在AI的发展路径上，通过架构革命，架构优化以

那摆在面前很现实的情况就是，东大已经在AI的发展路径上，通过架构革命，架构优化以及极具优势的电力成本走出来了，虽然在模型精度或者调用结果上存在一定缺失，中国头部大模型普遍采用MoE架构，这是实现低功耗、高吞吐的关键。海外模型架构大部分采用稠密模型，处理每个请求都需要调动全部参数（如GPT-4约1.8万亿参数），而MoE模型通过“门控网络”按需激活少量专家模块。诸如将模型精度从FP32降至INT4甚至FP8，模型体积缩小8倍，推理速度提升5倍，精度损失控制在3%以内，但是足以满足大量中低端需求，这也是海量调用的需求所在。

而草莓依旧玩的是大力出奇迹的路线，认为通用智能将需要无限算力。

未来的PK路径上就变成了高端估计需要稠密模型的支撑，但是中低端东大MoE架构路线实际上已经完全够用的两个发展路径。

但是真正能创造商业闭环的，反而是东大这个路线最容易跑通。

那么大概率，海外这些高端模型如果不能在未来创造可量化价值，那必然是要疯狂失血的，而因为东大的模型极具性价比和可以解决日常工作流程的赋能，才是真正可以干活的模型。

但是对应的就是，按照东大目前的发展路径看，算力基础设施支出的天花板就会大规模下压，海外这些疯狂昂贵的基建因为无法实现有效的商业闭环而纷纷倒闭。

这是导致后续AI鬼故事或者阶段泡沫破裂的可能路径。

万益资讯网

那摆在面前很现实的情况就是，东大已经在AI的发展路径上，通过架构革命，架构优化以

热门分类