华为大模型openPangu 2.0 的发布,展现了绝对的实力与行业引领力
华为在大模型战略上发生重大转向——从闭源走向全面开源,试图通过开源聚拢开发者、构建生态。全栈自主可控是核心目标——模型深度绑定昇腾芯片和鸿蒙系统,推动国产 AI 产业链协同发展。
华为将大模型视为鸿蒙生态的关键基础设施——助力鸿蒙从操作系统迈向"Agent 时代"。 余承东亲自挂帅,表明华为内部对大模型业务的高度重视,同时也反映出此前盘古发展不及预期的压力
一、技术层面:稀疏架构 + 超长上下文
openPangu 2.0 采用 MoE(混合专家)稀疏架构,兼顾大参数规模与高效推理:
版本 总参数量 激活参数量 上下文窗口
2.0 Pro 505B 18B 512K
2.0 Flash 92B 6B 512K
这种"大参数、小激活"的设计,使得模型在保持强大能力的同时,实际运行负载大幅降低,适配不同算力场景。512K 的超长上下文窗口也是目前业界领先水平。
二、生态战略:昇腾 + 鸿蒙深度绑定
openPangu 2.0 有两个显著特点:
1. 更亲和昇腾算力:单卡推理吞吐率达到其他主流开源模型的 2 倍,说明华为在软硬协同优化上做了大量工作,意在推动自家昇腾芯片的采用。
2. 更适配鸿蒙系统:针对鸿蒙生态中的智能体(Agent)任务进行了专门优化,执行"更快更准更省",助力鸿蒙全面迈入 Agent 时代。
这体现了华为 "芯片—框架—模型—系统"全栈自研、闭环协同 的战略意图。
三、开源策略:从"绝不开源"到全面开放
值得注意的是,华为此前对盘古大模型的态度是"不会开源"(2023年张平安曾明确表示)。此次 openPangu 2.0 不仅开源模型权重,还计划从 6 月 30 日起分批开放 7 大核心组件,包括:
- 预训练代码
- 后训练代码
- 训练算子
- 以及此前已开源的推理组件等
这意味着华为向开发者释放了完整的训练链路能力,大幅降低企业与开发者微调、二次开发的门槛。
四、余承东的表态:从"先驱者"到"追赶者"再到"争第一"
余承东在会上提到:
- 华为在 2020 年(全中国、全世界还不知道大模型为何物时)就发布了盘古大模型,是"绝对的全球先驱者"
- 后来"因为各种各样的原因没做好"
- 去年国庆节前夕,公司让他来负责大模型
- 他喊话:"自己的字典里没有第二,只有第一"
这番话既承认了盘古大模型此前发展不顺,也表达了华为在大模型领域重新发力的决心。
五、一个值得注意的背景
余承东还解释了 openPangu 2.0 总参数"仅"505B 的原因:"算力大量支持了国内的其他企业需求,自己留的数量还是非常有限的"。 这暗示华为在 AI 算力资源上优先保障了国内生态伙伴,自身训练资源受到一定制约,因此更聚焦在时延和吞吐率的提升上,而非单纯堆参数。
