华为昇腾算力暴涨2.87倍!5月6日凤凰卫视突发猛料,曾经被NVIDIA卡脖子的日子彻底结束,其在华份额直接归零,而国产算力异军突起,不仅实现跨越式暴涨,还吸引所有科技巨头扎堆合作,连顶尖AI企业都果断“弃CUDA投CANN”,这场逆袭背后,藏着怎样的硬核实力?
这几天科技圈最炸的消息,莫过于黄仁勋亲口承认英伟达在中国高端 AI 芯片市场的份额已经归零。那个曾穿着唐装、说着中文,在三伏天裹皮衣跑业务的“皮衣哥”,怎么也没想到,短短三年,英伟达就从垄断中国 95% 市场的绝对霸主,变成连一张高端 AI 芯片都卖不进来的“局外人”,而他亲手让出的市场,几乎全被华为昇腾接盘。
先说说这个惊掉下巴的 2.87 倍。很多人对这个数字没概念,我打个比方:以前你打开一个APP要3秒,现在换了华为昇腾芯片支撑的设备,1秒就能打开,同时开十几个APP也不卡。华为昇腾 950PR 推理芯片就是这么强势,在相同 AI 推理任务中,单颗芯片性能直接干到英伟达特供版 H20 的 2.87 倍。
这不是实验室理论数据,是 DeepSeek V4 大模型实际跑出来的结果——8K 文本输入场景下,昇腾 950PR 单卡推理解码吞吐量达 4700 TPS,延迟仅 20 毫秒,而 H20 吞吐量仅 1637 TPS,延迟约 57.4 毫秒,相当于华为芯片的回答速度是英伟达特供芯片的近3倍。
更关键的是,华为这次不是单点突破,整个生态都跟上了。以前大家总说,英伟达的 CUDA 生态是不可逾越的壁垒,国产芯片再强也没用。但 DeepSeek 用行动打破了这个神话:今年 4 月 24 日发布的 DeepSeek V4,是全球首个脱离 CUDA 生态的万亿参数级顶级 AI 大模型。
为了完成迁移,DeepSeek 不惜将原定2月发布的模型推迟两个月,全力将底层代码从 CUDA 重写为华为 CANN Next 框架。试运行显示,CANN 框架实现超 95% 的 CUDA 代码兼容性,开发者几乎不用改代码就能直接用;华为还针对昇腾 950PR 做了专项优化,让 70B 参数大模型显存占用减少 75%,仅需 35GB 就能运行,大幅降低部署门槛和成本。
订单是最好的投票,市场用脚做出了选择。DeepSeek V4 发布后,阿里、字节、腾讯等科技巨头纷纷向华为下单数十万颗昇腾芯片。有消息显示,仅字节和阿里就豪掷 475 亿锁定 40 万颗昇腾 950R 芯片,即便单价上浮 20%,依旧“一芯难求”。
华为昇腾 950 系列全年产量预计突破 75 万颗,营收直冲 820 亿,订单已排到 2027 年。就连中国移动 2026-2027 年 AI 设备集采,也明确指定华为 CANN 生态,采购 6208 张 AI 加速卡,这是运营商首次在集团层面大规模部署国产算力生态。
黄仁勋在采访中无奈表示,美国芯片管制政策“极其愚蠢”,是“失败者心态”——把英伟达排除出中国市场,不仅拦不住中国AI发展,反而把市场拱手让给华为。事实的确如此:据行业数据,国产 AI 芯片在中国市场的份额从 2023 年不足 5%,飙升至 2026 年的 41%,英伟达同期从 95% 暴跌至 0%。Bernstein Research 预测,到 2026 年底,华为昇腾在中国 AI 加速器市场份额可能升至 50%,英伟达或跌至 8%。
当然我们也不能盲目乐观,华为昇腾在大模型训练领域,和英伟达顶级的 B200、GB200 芯片还有差距,但差距正肉眼可见地缩小。华为副董事长徐直军去年 9 月公布了昇腾三年迭代路线:2026 年一季度的 Ascend 950、2027 年的 960、2028 年的 970,几乎以“一年一代、算力翻倍”的速度推进,用不了多久就能实现追赶甚至超越。
更重要的是,华为走的是完全自主可控的道路,从芯片设计、制造到软件生态全部自主,再也不用怕被“卡脖子”。这不仅关乎中国 AI 产业未来,也给全球提供了新选择——此前全球 AI 算力市场英伟达一家独大,各国只能被动接受其定价和规则,如今华为昇腾崛起,形成“双雄并立”格局,市场终于有了真正的竞争。
有人说,这是中国 AI 的“安卓时刻”,就像当年安卓打破 iOS 垄断,现在华为昇腾正打破 CUDA 生态的垄断。未来会有更多国家和企业选择华为算力,全球 AI 算力格局将被彻底改写。而这一切,都始于三年前美国对华为的极限打压,正如任正非所说:“华为今天的成就,要感谢美国政府的打压,是他们逼着我们走上了自主创新的道路。”


