这一周AI圈最大的一件事,并不是哪家公司又发布了新模型,而是两个本应保持距离的预言同时落地。5月初,Anthropic联合创始人Jack Clark在自己的Import AI通讯里发了一篇长文,他写道自己花了几周时间读了上百份公开数据,得出一个结论——2028年底之前,AI实现递归自我改进的概率是60%。几周后,他把这套论述带上了牛津大学的讲台。同期,Anthropic发布了旗下新成立的Anthropic Institute的研究议程,文件中写明已经看到"AI在加速AI自身的研发"的迹象,并认为公众应该被告知。这是一家头部AI实验室第一次把"智能爆炸"四个字写进自家正式文件。

差不多同一时间,谷歌DeepMind的CEO Demis Hassabis在Google I/O 2026大会上发出了基调相近的预警。他在主旨演讲中用"我们正站在奇点的山脚下"作为收尾,并在配套采访中表示,与人类智能相当的机器最早可能在2030年到来。他更精确的表述是"AGI将是工业革命的10倍体量,以10倍的速度展开,把100年压缩成10年"。媒体把这两个10倍相乘,演绎成了"工业革命的100倍"。这种数字游戏背后是一个共同信号:两家此前在路线和文化上分歧明显的顶级机构,几乎在同一周里给出了同样陡峭的时间表。
Clark他不是凭直觉给出60%这个数字。他列举了一连串能力曲线:SWE-Bench这一测试AI解决真实GitHub问题能力的基准,得分从2023年底Claude 2的约2%飙升到如今的93.9%;METR的时间跨度评估,从GPT-3.5时代的30秒,涨到当下前沿模型的约12小时。更刺眼的是Anthropic内部一项要求模型优化CPU小模型训练代码的测试,平均加速从2025年5月Opus 4的2.9倍跳到了2026年4月的52倍——而一个熟练人类研究员要达到4倍加速需要四到八小时。这些数据共同指向一个判断:AI已经在大幅替代AI工程师本身的工作。

这个判断在业内引发了正反两派的激烈反应。机器智能研究院的Eliezer Yudkowsky只回了一句话:"那你就会和我们其他人一起死掉"。而另一头,华盛顿大学机器学习教授、《终极算法》作者Pedro Domingos则给出冷水:自上世纪50年代LISP语言问世以来,AI就具备自我构建能力,真正的问题在于这个过程会带来递增收益还是递减收益,目前没有证据支持前者。独立研究者也指出,从"AI可以自动化AI工程的许多部分"到"AI能在2028年自主造出前沿继任模型"之间,论证仍然不足,证据只能证明加速,无法证明真正的递归自我改进。
在Clark敲响警钟的同一周,该公司在4月推出的Claude Mythos模型被披露具备国家级网络攻击能力,强大到Anthropic决定不向公众开放,只给少数企业和政府以"用于修补全球常用软件漏洞"的名义开放访问。与此同时,Anthropic在二级市场的隐含估值已突破1万亿美元,超过了OpenAI的8500亿。它还从马斯克的xAI手中接过了Colossus 1数据中心。一边在牛津讲台上喊"社会还没准备好",一边在伦敦开发者大会上推销自动写代码的Claude Code。

从2022年开始,美国持续收紧对华高端AI芯片出口管制,2025年又把H20、特定HBM存储和先进光刻设备纳入更严格的清单。台湾地区的台积电作为全球最先进制程的承制方,已经被深度绑进美方的供应链战略,台湾地区"经济部"多次配合美方更新管制名单。Anthropic的Anthropic Institute文件甚至直接引用了冷战类比,提出当年美苏之间为应对核危机设立过克里姆林宫热线,AI时代的对立大国之间也需要类似的地缘政治基础设施,"冷战的一个教训是,掌握能左右人类生死的技术的对手国家,最后都找到了对话的办法"。
2024年到2026年,国内头部大模型在多模态、长上下文、复杂推理上的进展,已经把与美方第一梯队的差距压缩到了几个月的量级,几款开源模型在国际评测榜单上反复登顶。国家层面早在2023年就率先出台《生成式人工智能服务管理暂行办法》,2024年的大模型备案制度和2025年针对训练数据、算力调度的配套规则,让中国成为全球极少数已经建立起完整AI治理框架的国家之一。在递归自我改进这种最前沿的范式上还有差距要补,但治理上的早起步给了战略缓冲。Hassabis自己也在2026年初承认,谷歌正是因为对中国AI竞争的紧迫感,才搞出了Gemini 3并重新拿回最先进模型的位置。

2028这个节点的真正重量在于它改写的不只是经济。一个能自主优化自身的AI系统,意味着情报融合、电子对抗、无人集群指挥、网络攻防的生成式自动化都会发生质变。Claude Mythos已经被外界描述具备国家级网络攻击能力,这本身就是一个明确的军事信号:前沿模型与军用能力之间的那堵墙,正在变薄。美军近年推动的"联合全域指挥控制"(JADC2)和"复制者"无人系统计划,背后都站着对AI能力跃迁的预期。如果2028年真的成为递归自我改进的元年,传统军力指标里关于兵员、装备、地理纵深的权重都要被重新校准,这不是危言耸听,而是任何一个负责任的安全研究者都必须摆上桌面的变量。

真正令人不安的,不是2028还是2030这个具体数字,而是另一个根本性的速度差。理解系统在做什么的工具,永远跟在让系统更强大的工具后面跑。可观测性总是在追赶,在前沿AI开发的尺度上,这种滞后带来的就不只是工程麻烦了。Anthropic自己最新的可解释性研究里,针对一个被刻意训练得"行为不对齐"的小模型,审计员在没有自然语言自编码器工具时识别出真实动机的成功率不到3%,用上之后也只有12%到15%。
这意味着面对一个会自我优化的AI,人类目前的"读心"能力还停留在十几个百分点。这场比赛的两条曲线,一条是能力,一条是可控性,前者在指数飙升,后者在线性爬坡。Jack Clark在牛津讲台上的预警可以被质疑,但有件事不能再推:当那个临界点真的到来时,规则该由谁来定,安全冗余该建多厚,这些问题中国必须有自己的答案,而且必须赶在2028年之前给出。