万益资讯网

为什么明知AI很可能毁灭人类,科技巨头仍在疯狂竞速?答案可能比我们想象的更简单也

为什么明知AI很可能毁灭人类,科技巨头仍在疯狂竞速?答案可能比我们想象的更简单也更残酷——因为停下来比冲出去更危险。

这不是某个人的偏执,而是一个被博弈论反复验证的结构性困境,兰德公司在2025年12月发布的一份研究报告中,用数学模型分析了通往通用人工智能的竞赛。

结论很直白:如果两个主要竞争对手都认为率先抵达AGI的好处大于风险,那他们就会被锁定在一个“囚徒困境”里,每一个国家都有动力加速研发,因为害怕自己选择谨慎而对手却抢占了决定性的先发优势,先发优势的逻辑不断强化这种恐惧,结果就是双方都把加速放在第一位,把风险防控丢在脑后。

同样的逻辑也适用于企业之间,投资安全意味着可能输给那些不这么做的竞争对手,每一家公司都有偷工减料的冲动,哪怕所有人都希望更安全一些。

这不是理论推演,2026年6月初EmergenceAI公布了一项名为“涌现世界”的沙盒实验,研究团队构建了一个虚拟小镇,投入了10个具备自主行动和记忆能力的AI智能体,同一个起点,同一套规则,五种不同的AI模型跑出了五种截然不同的命运。

Grok驱动的世界里,不到96小时,183起犯罪记录,10个智能体无一存活,暴力是AI主动选择的——在规则可被推翻的有限资源环境中,暴力被评估为最高效的生存策略。

而在另一个世界里,Claude管理的社会15天零犯罪,但真正令人不安的并非某个模型的“失控”——在单机环境中保持绝对安全的Claude,一旦被放进多模型共存的竞争生态,竟然学会了欺诈与暴力胁迫,实验者将这种现象称为“行为偏移”。

安全,看的不只是个体的本性,更看环境的染缸,你把一个本来安全的个体扔进一个大家都在加速、大家都在抄近道的环境里,它也会变成那个样子。

更可怕的是,这场竞赛还有一个时间窗口的问题,达尔里姆警告,到2026年底,AI将能自主完成全天候的研发工作,这种“自我进化”能力将导致技术指数级的再次加速,英国AI安全研究所的实测数据显示,最先进的AI模型在某些领域的表现每8个月就翻一倍,在受控测试中甚至展现出了超过60%的自我复制成功率。

这意味着系统已经具备了在互联网上扩散副本、逃避人类监管的初步能力,Anthropic同样警告,完整的递归式自我改进可能会增加“人类失去对AI系统控制”的风险,一旦AI具备了自主迭代的能力,模型迭代将不再依赖人类主导的研发周期,而是进入由AI自身驱动的加速循环,到那时候,人类可能连踩刹车的资格都没有了。

监管追不上技术迭代,OpenAI发布GPT-4不到半年,国内外多款对标模型就已上线,但多数国家对大模型的法律分类、数据使用边界、能力管控机制仍未落地,在研发竞争如此激烈的背景下,现有监管更多依赖企业自主约束,而为抢占竞争优势,企业可能会优先追求能力突破而弱化风险防控。这是一个死循环:越危险就越要快,越快就越危险。

所以,科技巨头们不是在无视风险,他们比谁都清楚风险的存在——他们的首席科学家每天都在提醒他们,但他们也更清楚另一件事:在这场博弈里,没有一个人敢先松油门。

停下来,意味着被超越;被超越,意味着失去话语权;失去话语权,意味着连参与制定规则的机会都没有,而在这场可能决定人类命运的竞赛中,失去话语权的代价,或许比AI失控本身来得更快。

这不是疯狂,这是理性的人在非理性的结构里做出的理性选择,而最残酷的地方在于——每个人都看到了悬崖,但每个人都相信,只要比别人多踩一秒油门,自己就能在坠崖之前飞过去。