DC娱乐网

海光DCU两连击:国产算力要的是全场景 也就一个月前,海光刚和智源FlagOS一

海光DCU两连击:国产算力要的是全场景
也就一个月前,海光刚和智源FlagOS一起搞定了千亿级MoE大模型DeepSeekV4 Flash的适配,解决了超长上下文、多卡并行等一系列硬骨头。转眼间,又把面壁智能的1B端侧模型MiniCPM5拿下了。
这不是简单地多适配一个模型,而是展示了一种能力边界,从云数据中心到边缘设备,海光DCU都能覆盖。这很关键。
大模型的未来,绝不是只有云端。端侧实时响应、隐私安全、成本可控,都是刚需。MiniCPM5这种小钢炮能在手机上跑出超越更大参数模型的成绩,而海光要做的,就是给开发者提供从训练到推理、从云到端的一致算力底座。
看看FlagOS这次的三板斧:vLLM-plugin-FL打通推理链路,FlagGems干掉CUDA依赖,Triton算子让国产芯片独立运行。这套组合拳打下来,开发者根本不用关心底层是海光还是其他芯片,业务代码不改,性能自动优化。
这才是国产算力生态该走的路。别总想着替代谁,而是通过开放、统一的软件栈,让用户无感地用上国产算力,还能获得更好的体验。海光连着两次Day0支持,证明这条路走得通。
国产算力 DCU