我问了用DeepSeek做算法的师弟,梁文峰为啥不肯接腾讯的投资。 师弟敲完最

冷暖人间论 2025-08-25 01:47:22

我问了用DeepSeek做算法的师弟,梁文峰为啥不肯接腾讯的投资。

师弟敲完最后一行代码,头都没抬:他觉得拿钱手短,做研究就不能让人指着鼻子走。

梁文峰今年初参加座谈会时,纪要里写着他提了国产大模型缺的不是快钱,是长期主义。三个月后他拿出NSA稀疏注意力架构,比常规训练省三十倍算力,前向传播速度提了九倍,论文里每个实验都跑在国产芯片上。

西部的电费每度三毛,数据中心成片建起来。DeepSeek用一万张GPU练出模型,马斯克不信,非说他们暗地里囤了五万张。

有些企业忙着对标GPT-5的时候,他们团队139人埋头优化推理成本,手机跑千亿模型不卡,还把自己研的注意力机制开源了。

师弟最后揉了揉手腕:你看他拒绝互联网巨头投资,可今年上半年AI岗位需求涨了百分之三十三,他们公司招聘邮箱被简历塞爆了。

没人喜欢被叫模仿者,尤其当你本来就能造浪。

0 阅读:100
冷暖人间论

冷暖人间论

捕捉城市的温度