万益资讯网

20倍吞吐量:英伟达破DeepSeek V4推理纪录

🚀英伟达通过全栈优化,在Blackwell平台上将DeepSeek V4模型的单Token推理成本降至行业最低水平,仅为一个月前的五分之一。
同时,英伟达通过多项技术创新,单GPU的Token吞吐量最高可提升20倍,大幅降低了AI推理的总体拥有成本。