国产DCU跑DeepSeek V4：Day0，能打！

4月24日，深度求索正式开源DeepSeek V4。同一天，海光DCU宣布完成对该模型的Day0适配，实现“模型发布—芯片适配—产业落地”的同步闭环。这意味着开发者和企业用户无需等待，即可基于海光DCU直接部署DeepSeek V4。

三个核心看点：

1.适配时效与性能调优

海光DCU团队在模型发布当天即完成深度调优，计算效率达到业内领先水平。不同于后续补适配的硬件方案，Day0策略大幅缩短了国产大模型从研发到生产环境的时间差。

2.全栈软件生态支撑

依托自研DTK异构计算平台，海光DCU提供覆盖训练、推理、AI4S等全场景的完整计算库。DAS人工智能基础软件系统已集成超2000个算子，兼容PyTorch、TensorFlow、vLLM、SGLang等100余个主流AI框架组件。通过算子调优、编译优化、通算融合等技术，DeepSeek V4的微调与推理性能获得明显提升。

3.规模化验证成果

目前海光DCU已完成超过400个国内外主流大模型的联合优化，覆盖全球99%的非闭源模型，包括Qwen、智谱GLM等。由数万张DCU组成的算力集群已稳定支撑多个万亿参数大模型的训练，证明其在真实超大规模场景下的工程化能力。

DeepSeek V4在海光DCU上的Day0适配，不仅是速度的比拼，也反映出国产算力底座对大模型迭代的跟随能力正在走向成熟。

DC娱乐网

国产DCU跑DeepSeek V4：Day0，能打！

热门分类