首发被华为抢了!英伟达急眼:当天火速官宣适配DeepSeek V4

趣百科 新闻资讯 1

4月25日消息,DeepSeek V4正式发布当天,华为昇腾CANN官方随即通过直播宣布V4已在昇腾平台完成首发,国产模型与国产算力的组合首次进入实战部署阶段。

消息传出的同一天,英伟达官方技术博客紧急发文,宣布DeepSeek V4已在Blackwell平台完成适配,并晒出实测数据——GB200 NVL72上每用户推理速度超过150 tokens/秒。

这份同日官宣,措辞专业、数据齐全,但发布节点之急迫,将焦虑暴露无遗。

更戏剧性的是,黄仁勋10天前才说过一句话。他在一档播客中直言,如果顶尖AI模型被优先优化用于华为芯片而非英伟达平台,这对我们而言将是灾难性的。

事实上,英伟达并非没有技术底牌。V4-Flash采用FP4+FP8混合精度,FP4目前仅Blackwell及之后的高端芯片原生支持。

值得一提的是,只靠Blackwell才能跑V4的壁垒,发布当天就被国产方案绕了过去。

智源FlagOS同日宣布实现了FP4到BF16的精度路径转换,将V4-Flash适配到了海光、沐曦、华为昇腾、摩尔线程、昆仑芯、平头哥真武、天数等8款以上国产芯片上,把适配周期从数周压缩至数天。

华为昇腾Atlas 350加速卡是国内目前唯一支持FP4低精度的推理产品,单卡算力达到英伟达H20的2.87倍。

DeepSeek官方也在定价说明中透露,预计下半年昇腾950超节点批量上市后,Pro版价格将大幅下调。

目前英伟达的NVIDIA NIM微服务已上线DeepSeek V4,SGLang和vLLM同步提供部署方案。从首日表现看,英伟达即便仍是主角,但不再是唯一的主角。