DC娱乐网

又是Day 0,海光这一周开始收割大模型头条了 前两天,海光DCU刚跟深度求索那

又是Day 0,海光这一周开始收割大模型头条了
前两天,海光DCU刚跟深度求索那边来了一个Day 0适配DeepSeek V4。才过去没四天,今儿商汤SenseNova U1一开源,海光DCU又端上了Day 0适配。再往前数两个月,2月份智谱开源的GLM-5,海光也是同一个节奏,同步上线。接连收割几个开源大模型的热点时刻,这种模型发布当日就能跑的交付力,已经不光是卷响应速度了。
业内把这种叫预适配,不是等代码公开了再加班赶,而是跟头部模型厂商早期对齐技术路线,模型一开源,工具链和算子库都已经准备好了。这背后靠的是海光DCU规模化的生态能力。光合组织已经聚了6000多家合作伙伴,覆盖芯片、整机、AI软件全产业链。加上DCU本身兼容类CUDA环境,算子覆盖度超过99%,支持PyTorch这些主流框架,存量代码基本可以无感迁移跑起来。
结合去年WAIC上,海光被商汤拉进“商汤大装置算力Mall”来看,这已经不只是适配得好能概括的了,商汤这边开源的步调节奏,海光在后台应该早就对好了。国模+国产芯的良性协作已经在驱动机器学习的落地速度了。
商汤 大模型