【AIGC日报 · 2026-05-27】
今日简讯:1、小米MiMo-V2.5系列API永久降价:最高降幅99%,输入最低0.02元/百万Token2、三大运营商集体推出"词元套餐":Token计费时代正式到来,电信9.9元起3、北京大学Helios:首个14B参数单卡实时长视频生成模型,单卡H100跑出19.5FPS4、深圳召开全国"人工智能+"能源推进会,国家能源局发布51个高价值应用场景5、逐际动力发布全尺寸交互人形机器人LimX Luna:零售价29.8万元6、OpenAI GPT-5.6曝光:150万Token上下文窗口,代号iris-alpha,6月发布7、xAI Grok V9-Medium训练完成:1.5万亿参数,用Cursor数据强化编程能力8、Figure 03人形机器人完成200小时全自动作业直播:分拣25万包裹零硬件故障
以下为详细内容:
1、小米MiMo-V2.5系列API永久降价:最高降幅99%,输入最低0.02元/百万Token来源:快科技、太平洋科技、界面新闻日期:2026年5月27日小米MiMo大模型官方宣布,MiMo-V2.5系列API永久降价,相比原始定价最高降幅达99%,不再区分上下文窗口长度。MiMo-V2.5输入缓存命中价格降至0.02元/百万Token,输出降至2元/百万Token;MiMo-V2.5 Pro输入降至0.025元、输出降至6元。Token Plan同步升级,同等价格下用量提升5-8倍,引入Credits统一计量。调价已于5月27日0:00全球生效。小米表示,降价背后是推理系统优化——基于SGLang HiCache支持SWA,将KV Cache数据搬运量降至优化前近1/7,可缓存Token数量提升近5倍。原文链接:小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度
2、三大运营商集体推出"词元套餐":Token计费时代正式到来来源:人民日报海外版、中国信通院日期:2026年5月27日今年一季度中国日均词元调用量突破140万亿。中国移动、中国联通、中国电信相继推出"词元套餐":移动湖北Lite版7.9元/月(1.8万次调用),Pro版39.9元/月(9万次);联通上海推出"一人公司"专属套餐,续约最低1元/百万Token;电信三档9.9/29.9/49.9元,分别含1000万/4000万/8000万Token。中国信通院曹峰指出,词元套餐改变了用户需分别向不同大模型厂商单独购买API的模式,通过运营商统一接口降低选择成本。中央财经大学欧阳日辉表示,AI大模型是"按次消耗的智能基础设施服务",Token将像短信和流量一样成为手机套餐标配。原文链接:网页链接
3、北京大学Helios:首个14B参数单卡实时长视频生成模型来源:网易、TechBeat人工智能社区日期:2026年5月26日北京大学硕士生袁盛海将在5月27日TechBeat社区分享Helios模型——首个14B参数单卡实时长视频生成模型。Helios在不依赖常见抗漂移策略(self-forcing、keyframe sampling等)的情况下,可生成高质量连贯的分钟级长视频;不借助KV-cache、causal masking等标准加速技术,在单张H100 GPU上端到端推理速度达19.5FPS。通过历史上下文和噪声上下文的深度压缩,4个14B参数模型可同时容纳在80GB显存中。该模型挑战了"大模型无法实时生成长视频"的行业认知,为实时长视频生成和交互式世界模型提供了新路径。原文链接:网页链接
4、深圳召开全国"人工智能+"能源推进会,国家能源局发布51个高价值场景来源:深圳特区报、国家能源局日期:2026年5月26日全国"人工智能+"能源现场推进会在深圳召开,国家能源局发布第一批51个能源领域AI应用高价值场景,涵盖电网、新能源、能源新业态等八大领域,并正式发布《中国"人工智能+"能源发展报告2026》。报告显示,2025年中国已建成42个万卡级智算集群,全国算力中心总用电量达1700亿千瓦时。深圳实践包括:深圳能源联合华为用盘古气象大模型提升风电预测准确率10%;南方电网发布电力行业首个多模态大模型"祝融2.0";腾讯联合远景打造全球首个100%绿电直供的算电协同数据中心。原文链接:网页链接
5、逐际动力发布全尺寸交互人形机器人LimX Luna:零售价29.8万元来源:新浪财经、36氪日期:2026年5月25日逐际动力正式发布全尺寸交互人形机器人LimX Luna,面向商业服务场景。身高160cm,27个机身自由度,集高动态运控与多模态交互于一体,支持视频学舞、零代码任务编排与智能群控。国内零售价29.8万元,现已开放全球预订。这是继宇树科技冲刺科创板IPO之后,国内又一人形机器人整机产品走向商业化交付。原文链接:网页链接
6、OpenAI GPT-5.6曝光:150万Token上下文窗口,6月发布来源:IT之家、搜狐科技、澎湃新闻日期:2026年5月26日多名开发者在OpenAI Codex后端日志中发现未公布模型GPT-5.6,内部代号iris-alpha。上下文窗口达150万Token,较GPT-5.5的105万提升43%。实测显示输入90万Token时模型仍流畅响应,可完美处理超过105万Token的请求。后端日志还发现ember-alpha和beacon-alpha两个版本。GPT-5.6前端生成能力也有显著提升,几乎无需详细提示词即可直接生成接近商用级的应用界面。6月还将迎来Claude Sonnet 4.8、Gemini 3.5 Pro、Grok 5密集发布。原文链接:OpenAI GPT-5.6 模型曝下月发布:上下文窗口达 150 万 tokens,提升约 43%
7、xAI Grok V9-Medium训练完成:1.5万亿参数,用Cursor数据强化编程来源:36氪、新智元、51CTO日期:2026年5月26日马斯克在X上官宣,1.5万亿参数的Grok基础模型V9-Medium已完成训练,参数量为现役0.5T模型的三倍,2-3周内面向公众发布。训练过程中灌入大量Cursor编程交互数据,后续还会继续扩充。马斯克承认现役v8-small在训练数据质量上存在严重缺陷。同期发布的Grok Build为AI编程智能体,支持Plan Mode(先规划后执行)、最多8个并行子智能体、Arena Mode方案打擂,原生支持MCP和ACP。现役0.5T模型计划年底开源。原文链接:xAI解散,但Grok还在上新,马斯克官宣新模型
8、Figure 03人形机器人完成200小时全自动作业直播:分拣25万包裹零硬件故障来源:IT之家、界面新闻、IEEE Spectrum日期:2026年5月25日Figure AI旗下Figure 03人形机器人完成长达200小时全自动作业直播,三台机器人轮班分拣近25万个包裹,全程零硬件故障,远超最初8小时耐力挑战目标。单包用时2.6秒快于人类平均3秒。CEO Brett Adcock称此举旨在改变机器人行业"只展示剪辑后完美瞬间"的宣传模式。IEEE Spectrum评论指出,200小时零故障在真实仓库环境中完成,意味着供应链、机械结构、软件控制均已通过可靠性门槛,仓储物流的劳动力结构将开始实质性重构。原文链接:网页链接
AI创造营德里克文德里克文AI日报
