红杉资本:AI已经进入下一个竞争阶段
凝阳聊商业
2024-11-06 00:09:05
人工智能领域,过去12个月的标志性项目是模型性能的竞争。这一阶段的特点是寻求新的研究技术、更好的训练数据和更大的集群规模。
人工智能竞赛的下一阶段将会有所不同:它将更多地由物理建设而非科学发现来定义。
你可以通过主机代管或改造将训练集群安置在现有的数据中心。如果要将集群规模从1.5万个GPU增加到2.5万个GPU,你会找到插入更多GPU的方法。这种情况正在改变:下一代模型的目标是将模型规模扩大10倍,达到30万个GPU。要容纳其中一个模型,你需要建造一整个全新的数据中心。
这从两个根本方面改变了人工智能:首先改变了模型之间的交付周期。以前你可以在6到12个月内训练你的模型,现在需要在实际开始训练之前增加18到24个月的建设时间。其次,它改变了最大竞争优势的来源。在新时代,建设效率可能比研究突破更重要。
大型科技公司的年化资本支出同比从1380亿美元增加到2290亿美元。这910亿美元的增量运行率支出是新人工智能数据中心建设的一个很好的近似值——一项巨大的投资。
今天的资本支出可能会在2025年末到2026年初之间取得成果,到那时我们将发现这些更大的模型是否足够智能,以解锁新的收入来源并产生投资回报。
五家公司已经站在了这场数据中心规模扩大新竞赛的起跑线上:微软/OpenAI、亚马逊/Anthropic、谷歌、Meta和xAI。我们可以开始看到每个参与者将如何根据自己的业务基本面采取独特的方法来取胜:
Meta和xAI是消费类公司,它们都将进行垂直整合,希望受益于各自都有一个单一的创始人决策者,简化并紧密结合模型构建工作与数据中心设计和建设,两家都将寻求在更智能的模型基础上推出杀手级消费应用程序。
微软和亚马逊拥有经验丰富的数据中心团队和雄厚的资金,并且它们利用这些资产与顶级研究实验室建立了合作伙伴关系。希望通过以下方式实现盈利:1)向其他公司出售训练服务;2)出售模型推理服务。它们需要在前沿模型和为企业客户使用而建造的其他数据中心之间管理资源分配。
谷歌既有消费业务又有云业务,还有自己的内部研究团队,还通过TPU一直垂直整合到芯片层。这些因素应该提供长期的结构性优势。
0
阅读:125
看
感谢分享
六
看来未来的AI真的是在比谁家的GPU更多啊!等我们老了,讲故事的开头可能是:当年我家数据中心比你家多一万颗GPU!