万万没想到,DeepSeek的创始人梁文锋,连续三年收到美国方面的学术交流邀请,每一次都被他干脆利落地拒绝了。
很多人是在DeepSeek R1爆火之后,才第一次知道梁文锋这个名字。在此之前,他几乎是人工智能圈里最低调的创业者。
他很少接受媒体采访,也从不参加各种行业峰会和颁奖礼。外界能找到的关于他的公开信息,少之又少。他把所有的时间和精力,都藏在了实验室的代码里。
梁文锋是数学专业出身,早年曾在微软亚洲研究院工作,后来加入阿里达摩院,担任资深科学家,负责大模型相关的核心技术研发。
2023年,他带着十几个人的核心团队离开阿里,创办了深度求索DeepSeek。当时国内大模型赛道已经异常火热,几十家公司扎堆入场,烧钱抢人、营销造势成了行业常态。没有人看好这个只有十几个人的小团队,觉得他们根本没有机会和那些巨头竞争。
就在DeepSeek成立的第一个月,美国一个顶尖的人工智能学术会议就给梁文锋发来了邀请。主办方希望他能去做主题演讲,分享自己在大模型领域的研究成果,还承诺给他提供头等舱机票和五星级酒店的住宿,以及一笔不菲的演讲费。梁文锋连邮件都没有回,直接拒绝了。
团队里有人觉得可惜,说这是提升公司国际知名度的好机会。梁文锋只是摇了摇头,说现在不是出去露脸的时候。我们的技术还差得远,所有的精力都应该放在研发上。出去讲再多漂亮话,不如拿出一个真正能打的产品。
2024年,美国方面又发来第二次邀请,这次是全球人工智能行业峰会,邀请梁文锋作为特邀嘉宾出席。
梁文锋再次拒绝。2025年年初,美国某顶尖实验室主动联系梁文锋,希望能和DeepSeek开展深度技术合作,邀请他去美国进行为期三个月的交流访问。这一次,梁文锋还是毫不犹豫地说了不。
他跟团队说,我们做技术不是为了拿什么国际奖项,也不是为了得到别人的认可。我们的目标很简单,就是做出中国人自己的大模型,把核心技术牢牢掌握在自己手里。如果我们的技术真的足够好,不用我们去找别人,别人自然会来找我们。如果技术不行,去再多的会议,交再多的朋友,也没有用。
DeepSeek确实做到了。他们没有把钱花在营销和公关上,几乎所有的融资都投入到了研发中。公司里没有复杂的层级,也没有繁琐的流程。梁文锋自己和普通员工一样,坐在开放的办公区里,每天最早到公司,最晚离开。他吃住都在公司附近,有时候为了赶项目进度,干脆就在公司的沙发上凑合一晚。
2025年3月,DeepSeek毫无征兆地发布了R1推理模型。这个消息像一颗炸弹,瞬间炸翻了整个全球人工智能界。R1的数学推理和逻辑能力,不仅全面超越了当时所有的开源大模型,甚至在很多关键指标上超过了GPT-4o。更让所有人震惊的是,DeepSeek直接把R1模型完全开源,任何人都可以免费下载和使用。
一夜之间,全世界的开发者都开始用DeepSeek的模型。美国的科技巨头们彻底慌了。
他们怎么也想不到,一个成立才两年的中国公司,竟然能做出比他们更好的大模型,而且还敢直接开源。很多美国公司和实验室再次联系梁文锋,想要高价收购DeepSeek的技术,或者寻求独家合作,都被梁文锋一一拒绝了。
梁文锋说,开源是我们从一开始就定下的原则。大模型不应该被少数几家公司垄断,它应该服务于全人类。我们欢迎平等的技术交流,但是绝对不会用核心技术做交易。任何想要限制我们、卡我们脖子的行为,最终都只会逼着我们变得更强。
这件事在网上引发了巨大的反响。很多网友说,梁文锋才是真正的国之栋梁。他不追名逐利,不搞噱头,默默深耕技术,用实力打了所有人的脸。
有人说,以前总觉得中国的科技不如美国,现在才发现,我们从来不缺聪明的人,缺的是像梁文锋这样沉下心来做事的人。还有人说,正是因为有这样一群埋头苦干的人,中国的科技才能一步步走到今天。
其实梁文锋拒绝的从来不是学术交流,而是不平等的对待和别有用心的拉拢。他比谁都清楚,核心技术是买不来、求不来的。只有靠自己一步一个脚印地研发,才能真正挺直腰杆。他用自己的选择告诉所有人,中国人完全有能力做出世界顶尖的科技产品。
各位读者你们怎么看?欢迎在评论区讨论。
