DC娱乐网

国产DCU跑DeepSeek V4:Day0,能打!

4月24日,深度求索正式开源DeepSeek V4。同一天,海光DCU宣布完成对该模型的Day0适配,实现“模型发布—芯

4月24日,深度求索正式开源DeepSeek V4。同一天,海光DCU宣布完成对该模型的Day0适配,实现“模型发布—芯片适配—产业落地”的同步闭环。这意味着开发者和企业用户无需等待,即可基于海光DCU直接部署DeepSeek V4。

三个核心看点:

1.适配时效与性能调优

海光DCU团队在模型发布当天即完成深度调优,计算效率达到业内领先水平。不同于后续补适配的硬件方案,Day0策略大幅缩短了国产大模型从研发到生产环境的时间差。

2.全栈软件生态支撑

依托自研DTK异构计算平台,海光DCU提供覆盖训练、推理、AI4S等全场景的完整计算库。DAS人工智能基础软件系统已集成超2000个算子,兼容PyTorch、TensorFlow、vLLM、SGLang等100余个主流AI框架组件。通过算子调优、编译优化、通算融合等技术,DeepSeek V4的微调与推理性能获得明显提升。

3.规模化验证成果

目前海光DCU已完成超过400个国内外主流大模型的联合优化,覆盖全球99%的非闭源模型,包括Qwen、智谱GLM等。由数万张DCU组成的算力集群已稳定支撑多个万亿参数大模型的训练,证明其在真实超大规模场景下的工程化能力。

DeepSeek V4在海光DCU上的Day0适配,不仅是速度的比拼,也反映出国产算力底座对大模型迭代的跟随能力正在走向成熟。