有订阅不一定能盈利,这是这个场景目前非常尴尬的处境。
之前研究机构SemiAnalysis的最新压力测试揭示了一个触目惊心的现实:高端订阅套餐的定价远低于实际算力成本。OpenAI ChatGPT Pro(200美元/月):若用户将额度用满,对应API成本高达1.4万美元,是订阅价格的70倍。一旦用户使用率超过5.7%,该用户就从盈利转为亏损;若使用率达100%,毛利率会暴跌至-1650%。Anthropic Claude Max(200美元/月):极限使用下成本约8000美元,盈亏平衡点约为10%-20%的使用率。普通订阅同样承压:20美元/月的ChatGPT Plus最大可消耗价值700美元的API资源,Claude Pro则为400美元,盈亏平衡点分别在11.4%和20%。
重度用户(如高频编程、复杂Agent工作流)本质上是在“薅厂商羊毛”,每个这样的用户都在加剧厂商的亏损。
于此,Anthropic甚至因此封禁了OpenClaw等第三方工具使用订阅额度,强制其走API按量付费路径。OpenAI在2026年4月将Codex从“按消息计费”改为按Token计费,随后扩展到全部存量企业客户。GitHub Copilot:也在2026年4月宣布全线转向AI Credits计费模式,10美元月费附带10美元积分,超额后按Token计费。
逐渐就演变成:想要定高价但是用户买不起单,而定价低了,自己就可能入不敷出。因为高昂的算力投入实际上就是重资产,都会呈现庞大的资产折旧压力,这种压力逃不掉,如果还有昂贵的债务利息,那就是雪上加霜。以及现在这种Agent的算力消耗,需要的算力消耗不一定能创造出对应的价值,这是矛盾点所在。
就算是现在的订阅支出下,用户也都在通过将复杂任务交由前沿模型、常规需求下放至廉价模型的方式削减AI运营成本。甚至有初创公司转向DeepSeek等性价比更高的模型。
AI大模型不会像传统互联网一样“赢者通吃”。因为:边际成本不为零,用户越多成本越高。用户迁移成本低。开源生态(如Llama、DeepSeek)正在缩小与闭源模型的差距。
所以所谓的高端闭源模型投入巨大之后最终可能发现入不敷出,开原模型又在不断蚕食他们希望获得的客群和用户。诸如通过硬件迭代、软件优化、模型架构创新等模式,DeepSeek V4-Pro价格降至原价的1/4,且是永久性降价。
最终只能通过挤掉泡沫和昂贵的成本之后,回归到最质朴的商业路径:既性价比和投入产出比的最终决胜。
而这种PK过程中,AI的发展不一定停滞,但是这些财务投入激进而无法找到合理回报闭环的模型厂商,会嘎掉一大批,进而才是对于激进的基建投入的灵魂拷问啊。
所以现在看看全球模型调用排行,在想想海外大厂目前疯狂基建所面临的处境和压力,结合DS这样的架构态势,但凡国内供给和算力模型继续迭代,海外这些疯狂投入的成本沉没的鬼故事估计真要成真了。
海外与国内的定价差距已达645倍:以同等调用规模计算,海外巨头GPT-5.5长上下文版本的价格,已达到国产DeepSeek-V4-Pro的40倍以上;中美模型价差最高达645倍。海外厂商“御三家”(OpenAI、Google、Anthropic)试图维持高毛利和高ARPU,靠高端企业客户覆盖巨额算力成本;而国内厂商则疯狂压缩利润甚至亏本补贴,旨在通过海量用户和Token调用量摊薄成本。
这种双轨制意味着:如果国内模型持续迭代、成本持续下降,海外厂商高举高打(巨额基建+高定价)的商业模式将面临严重的客户流失和成本沉没风险。高投入不一定能换来高回报,尤其是在用户对价格极度敏感、迁移成本极低的环境下。
最后,就是Agent现在是Token最大调用的所在,Agent如果真正大规模落地并创造可量化价值,那可能还有一线生机,否则呢。。。
这就又回到了Agent到底是流程辅助还是真正颠覆未来的数字劳动力,只能交给时间来确认了,但是这个节点到来之前,债务支出都是刚性的压力,客观存在。