那摆在面前很现实的情况就是,东大已经在AI的发展路径上,通过架构革命,架构优化以及极具优势的电力成本走出来了,虽然在模型精度或者调用结果上存在一定缺失,中国头部大模型普遍采用MoE架构,这是实现低功耗、高吞吐的关键。海外模型架构大部分采用稠密模型,处理每个请求都需要调动全部参数(如GPT-4约1.8万亿参数),而MoE模型通过“门控网络”按需激活少量专家模块。诸如将模型精度从FP32降至INT4甚至FP8,模型体积缩小8倍,推理速度提升5倍,精度损失控制在3%以内,但是足以满足大量中低端需求,这也是海量调用的需求所在。
而草莓依旧玩的是大力出奇迹的路线,认为通用智能将需要无限算力。
未来的PK路径上就变成了高端估计需要稠密模型的支撑,但是中低端东大MoE架构路线实际上已经完全够用的两个发展路径。
但是真正能创造商业闭环的,反而是东大这个路线最容易跑通。
那么大概率,海外这些高端模型如果不能在未来创造可量化价值,那必然是要疯狂失血的,而因为东大的模型极具性价比和可以解决日常工作流程的赋能,才是真正可以干活的模型。
但是对应的就是,按照东大目前的发展路径看,算力基础设施支出的天花板就会大规模下压,海外这些疯狂昂贵的基建因为无法实现有效的商业闭环而纷纷倒闭。
这是导致后续AI鬼故事或者阶段泡沫破裂的可能路径。