我真的震惊，全球最大的AI开源社区Hugging Face，居然主动掏了自己的钱

我真的震惊，全球最大的AI开源社区Hugging Face，居然主动掏了自己的钱，给一个中国模型提供了6小时的全球免费算力？

如果你了解一点AI行业的背景，会发现这里面藏着一个很大的信号。

1先简单说一下发生了什么。

6月17日，智谱发布了他们最新的旗舰模型GLM-5.2，以MIT协议完全开源，允许免费商用。

Hugging Face看到之后，第一时间宣布为这个模型提供专属的免费算力通道。

要知道，这还是Hugging Face头一次给国产模型开这种绿灯。

然后马斯克在社交平台上被人问到，中国模型什么时候能达到Fable那个水平。他回了一句，大概2027年一季度吧。

智谱创始人唐杰直接隔空回了一句：用不了那么久。

海外开发者社区里，不少人觉得马斯克这次判断太保守了。

看到这里你可能会问：GLM-5.2到底强在哪，为什么这么多人关注？

2之前编程模型这条赛道，长期就是海外几家大厂互相卷，Claude、GPT、Gemini，大家一般管这三位叫御三家。

国产模型虽然在追，但在最核心的coding能力上，尤其是大型工程级别的长任务，跟御三家始终有一道肉眼可见的距离。

但直到智谱发布了GLM-5.2，我第一时间拿手头的真实项目去跑了两轮测试。

跑完之后只有一个感受：御三家的席位，真的该重新排了。

在Artificial Analysis综合榜单上，GLM-5.2拿了51分，跟Anthropic和OpenAI的旗舰模型并列全球前三，并位列开源模型 SOTA。

在Code Arena这个全球百万用户参与盲测的前端开发评估平台上，GLM-5.2排到了全球可用模型第一。

再看长任务能力。

FrontierSWE是专门考验AI在超长工程任务上能撑多久的评测，有些任务要求模型连续工作20小时。

GLM-5.2目前仅次于Claude Opus 4.8，差距大概在1%到4%之间。

但光看榜单没意思，咱们直接上手测。

3我以Ghostfolio这个代码库作为测试案例，拿它来试试GLM-5.2的1M上下文到底是不是真的能用。

我把整个代码库一次性投喂进去，然后给它下了下面几个任务👇

GLM-5.2这次的表现让我挺意外的，它给我输出了一份非常详细的17页的后端架构分析报告。

在模块结构总览部分，它梳理了 28 个业务模块和 22 个共享服务模块，列出每个模块的职责和关键 API 端点。

它生成的依赖关系图，按六大功能领域分组绘制文本依赖图，Portfolio 以 20 个直接依赖居首。五类隐式耦合 — Bull 队列（7 生产者共享）、CronService（6 个跨模块调用链）、Redis 缓存键（3 模块共享键格式）、EventEmitter（5 发布者 1 监听器）、Prisma 共享表（SymbolProfile 写-写冲突、Property 万能表）。

它最后还给了我五条详细的重构建议，统一事件总线、拆分 Portfolio 模块、建立数据表访问门控层、完善/移除未实现计算器、解耦 CronService。

如果只是改一个函数或者写个小脚本，1M跟200K真没什么体感差异。但整库级别的理解和分析，这不是快慢的问题，是能做和做不了的问题。

4第二个测试我想验证的是GLM-5.2的长任务自主执行能力。

我给它的需求就一句话：帮我做一个团队周报收集系统，支持成员提交周报、管理员查看汇总、按周归档，要有Web端和移动端适配。

没有产品文档，没有原型图，然后我就看着它自己干活。

它先拆解了需求，确定了技术栈，接着开始搭项目结构，然后就是一个模块一个模块地写：用户认证、周报提交表单、管理员面板、数据汇总、按周归档查询。

整个过程中间它经历了几百次工具调用和文件读写。

从需求输入到最终交付一个能跑的完整应用，总共花了大概两个半小时。

以前这种从零开始构建一个多端应用的活儿，一个小团队怎么也得干上一两周。

但现在模型能自主完成到这个程度，说实话超出了我的预期。

5可能有人会说，1M上下文不是很多模型都标了吗？

但标称1M和真正能用的1M，完全是两码事。