海光DCU和智源这次干得漂亮，MiniCPM5上线即适配。面壁刚开源的Min

海光DCU和智源这次干得漂亮，MiniCPM5上线即适配。

面壁刚开源的MiniCPM5-1B，海光DCU依托智源的众智FlagOS当天就适配完了。不只是“能跑”，首Token延迟（TTFT）这个核心体验指标，在各种测试场景下全面低于NVIDIA H20原生部署。

做过大模型推理的人都知道，TTFT直接影响用户感知——聊天机器人半天蹦不出第一个字，用户早划走了。国产卡以前被人诟病“反应慢半拍”“适配拖后腿”，这次海光做到了“发布即支持”，体验反向超车。

凭什么能做到？海光的底子摆在那。DCU本身的架构设计能扛端侧模型的低延迟要求，再加上这几年在软件栈上的持续投入，跟400多个主流大模型做过联合优化，适配流程已经标准化了。之前刚跑通DeepSeek-V4那个千亿级模型，从云到端全谱系覆盖，经验积累到位了。

以前总觉得国产算力在“追赶”，这次海光至少在端侧推理这个细分战场上，做到了效率追平甚至局部超越。对行业来说，这是个挺强的信心信号。
海光信息DCU 国产算力

DC娱乐网

海光DCU和智源这次干得漂亮，MiniCPM5上线即适配。面壁刚开源的Min

热门分类

海光DCU和智源这次干得漂亮，MiniCPM5上线即适配。 面壁刚开源的Min

热门分类

海光DCU和智源这次干得漂亮，MiniCPM5上线即适配。面壁刚开源的Min