海光DCU和智源这次干得漂亮,MiniCPM5上线即适配。
面壁刚开源的MiniCPM5-1B,海光DCU依托智源的众智FlagOS当天就适配完了。不只是“能跑”,首Token延迟(TTFT)这个核心体验指标,在各种测试场景下全面低于NVIDIA H20原生部署。
做过大模型推理的人都知道,TTFT直接影响用户感知——聊天机器人半天蹦不出第一个字,用户早划走了。国产卡以前被人诟病“反应慢半拍”“适配拖后腿”,这次海光做到了“发布即支持”,体验反向超车。
凭什么能做到?海光的底子摆在那。DCU本身的架构设计能扛端侧模型的低延迟要求,再加上这几年在软件栈上的持续投入,跟400多个主流大模型做过联合优化,适配流程已经标准化了。之前刚跑通DeepSeek-V4那个千亿级模型,从云到端全谱系覆盖,经验积累到位了。
以前总觉得国产算力在“追赶”,这次海光至少在端侧推理这个细分战场上,做到了效率追平甚至局部超越。对行业来说,这是个挺强的信心信号。
海光信息DCU 国产算力
