梁文锋又冲上热搜了! 这次既不是团队内讧也不是技术翻车, 反倒给AI圈扔了颗惊雷

凝阳高岗 2026-01-22 05:35:29

梁文锋又冲上热搜了! 这次既不是团队内讧也不是技术翻车, 反倒给AI圈扔了颗惊雷。而是他们居然又 ​​开发了新的模型!1月21日外媒曝光,梁文锋在DeepSeek发布推理模型R1一周年之际,新模型“MODEL1”的项目名在开源社区悄然出现。 谁能想到,去年靠R1模型惊艳全球的DeepSeek,一年后直接甩出王炸。R1曾以29.4万美元低成本,干出上亿模型效果,还一举登上Nature封面。 R1在Hugging Face下载量早破1090万次,远超Meta的LLaMA2,AIME竞赛准确率飙到86.7%,把九成人类选手远远甩在身后。MODEL1的曝光,显然是要把优势拉满。 从GitHub代码能看出,MODEL1彻底换新架构,不再走V3系列老路。适配64和128头维度,支持FP8稀疏解码,显存占用狂降35%,推理速度直接提升40%。 更亮眼的是它适配国产算力和NVIDIA新架构,计算吞吐量冲到660 TFlops,普通配置也能轻松跑大模型,直接化解了不少企业的算力焦虑。 有消息称MODEL1主打编程能力,内部测试已经超越Claude和GPT系列,春节前后就会正式发布。开源社区开发者早就蹲守,就等权重开放的那一刻。 AI圈曾流行“烧钱即正义”,巨头动辄砸上亿训练模型。梁文锋偏不按常理出牌,靠开源和极致效率,硬生生蹚出国产AI的破局之路。 去年R1开源让中小企业不用再被大厂API卡脖子,深圳有家初创公司靠它把医疗系统成本砍到五分之一,真正实现技术普惠。 现在开源模型市场占比已达67%,2026年企业自建模型比例预计超60%。DeepSeek这步棋,不仅是技术迭代,更是在改写AI领域的游戏规则。 MODEL1能否延续R1的神话,带领国产开源模型继续领跑全球?这份期待,值得所有关注AI发展的人蹲守答案。 deepsig 晒图笔记大赛 各位读者你们怎么看?欢迎在评论区讨论。

0 阅读:0
凝阳高岗

凝阳高岗

感谢大家的关注