【AI大模型周报】两大重磅更新,智能体时代加速到来
OpenAI于4月23日发布GPT-5.5(代号Spud),定位"Agent原生"旗舰模型。这是从GPT-4.5以来首次完整重训练的旗舰模型,采用MoE稀疏激活架构,在MLE-Bench(Kaggle竞赛Agent评测)中拿下最高分。实测可稳定自主连续工作7小时以上,完成相同任务所需token量大幅减少。在医疗、法律、金融等高风险场景中,幻觉声明较前代减少52.5%。目前提供Standard、Thinking、Pro三个版本,上线ChatGPT向所有用户免费开放。
同周,智谱AI发布并开源GLM-5.1,以744B参数刷新开源模型性能天花板(SWE-bench Pro得分58.4%,当前开源最高)。这是全球首个支持单任务8小时以上持续自主执行的开源工程智能体,在KernelBench Level 3优化任务中自主实现3.6倍加速。全部基于华为芯片训练,编码能力达Claude Opus 4.6的94.6%。MIT协议开源,发布24小时内Hugging Face下载超1.2万次。
两条路线同时突破:OpenAI以闭源引领Agent工业化落地,智谱以开源验证国产硬件训练能力。大模型正从"对话助手"全面进化为"自主执行者"。AI资讯 人工智能