【AI大模型周报】两大重磅更新，智能体时代加速到来 OpenAI于4月23日发

【AI大模型周报】两大重磅更新，智能体时代加速到来

OpenAI于4月23日发布GPT-5.5（代号Spud），定位"Agent原生"旗舰模型。这是从GPT-4.5以来首次完整重训练的旗舰模型，采用MoE稀疏激活架构，在MLE-Bench（Kaggle竞赛Agent评测）中拿下最高分。实测可稳定自主连续工作7小时以上，完成相同任务所需token量大幅减少。在医疗、法律、金融等高风险场景中，幻觉声明较前代减少52.5%。目前提供Standard、Thinking、Pro三个版本，上线ChatGPT向所有用户免费开放。

同周，智谱AI发布并开源GLM-5.1，以744B参数刷新开源模型性能天花板（SWE-bench Pro得分58.4%，当前开源最高）。这是全球首个支持单任务8小时以上持续自主执行的开源工程智能体，在KernelBench Level 3优化任务中自主实现3.6倍加速。全部基于华为芯片训练，编码能力达Claude Opus 4.6的94.6%。MIT协议开源，发布24小时内Hugging Face下载超1.2万次。

两条路线同时突破：OpenAI以闭源引领Agent工业化落地，智谱以开源验证国产硬件训练能力。大模型正从"对话助手"全面进化为"自主执行者"。AI资讯人工智能

万益资讯网

【AI大模型周报】两大重磅更新，智能体时代加速到来 OpenAI于4月23日发

热门分类