【中国AI产业构建自主生态关键进展:国产大模型完成了从英伟达CUDA生态向华为CANN框架的全栈重构】2025年英伟达在中国AI加速卡市场的份额已从两年前的95%降至55%,而国产芯片份额首次突破41%,其中华为昇腾出货量占国产芯片的近一半。 2026年4月,国产大模型公司深度求索发布新一代大模型DeepSeek-V4。该模型在研发、训练、推理全流程均采用华为昇腾芯片作为核心算力支撑,完成了从英伟达CUDA生态向华为CANN框架的全栈重构。华为同步宣布昇腾超节点全系列产品及华为云已全面支持DeepSeek-V4。
此次合作首次验证了万亿参数级别的大模型可完全基于国产算力平台实现稳定运行,打破了“高端AI训练只能依赖英伟达”的行业固有认知,被视为中国AI产业降低对外部单一技术路径依赖、构建自主生态的关键进展。
性能方面,基于昇腾950超节点,在8K输入场景下,DeepSeek-V4-Pro模型的推理时延(TPOT)可达到约20毫秒,V4-Flash模型可达到约10毫秒。
作为对比,昇腾950PR的性能明显优于英伟达的H20晶片,后者是英伟达此前获准在中国销售的最强型号,直至去年北京禁止其进口。昇腾950PR晶片标志着华为在多年难以从中国科技行业赢得大额订单后取得突破。路透社此前3月曾报道称,这款晶片今年早些时候的客户测试进展顺利,包括字节跳动和阿里巴巴在内的企业在1月收到样品后计划下单。


