又是Day 0，海光这一周开始收割大模型头条了前两天，海光DCU刚跟深度求索那

又是Day 0，海光这一周开始收割大模型头条了
前两天，海光DCU刚跟深度求索那边来了一个Day 0适配DeepSeek V4。才过去没四天，今儿商汤SenseNova U1一开源，海光DCU又端上了Day 0适配。再往前数两个月，2月份智谱开源的GLM-5，海光也是同一个节奏，同步上线。接连收割几个开源大模型的热点时刻，这种模型发布当日就能跑的交付力，已经不光是卷响应速度了。
业内把这种叫预适配，不是等代码公开了再加班赶，而是跟头部模型厂商早期对齐技术路线，模型一开源，工具链和算子库都已经准备好了。这背后靠的是海光DCU规模化的生态能力。光合组织已经聚了6000多家合作伙伴，覆盖芯片、整机、AI软件全产业链。加上DCU本身兼容类CUDA环境，算子覆盖度超过99%，支持PyTorch这些主流框架，存量代码基本可以无感迁移跑起来。
结合去年WAIC上，海光被商汤拉进“商汤大装置算力Mall”来看，这已经不只是适配得好能概括的了，商汤这边开源的步调节奏，海光在后台应该早就对好了。国模+国产芯的良性协作已经在驱动机器学习的落地速度了。
商汤大模型

DC娱乐网

又是Day 0，海光这一周开始收割大模型头条了前两天，海光DCU刚跟深度求索那

热门分类

又是Day 0，海光这一周开始收割大模型头条了 前两天，海光DCU刚跟深度求索那

热门分类

又是Day 0，海光这一周开始收割大模型头条了前两天，海光DCU刚跟深度求索那