算力投资风向变了,海光给出了新解答
智博会上逛了一圈,跟几个做算力运营的朋友聊,发现大家的共识都是企业客户现在算账算得贼细。今时不同往日,现在人家看的都是:你的卡真实利用率能到多少?跨集群调度损耗多大?跑一个典型应用,单Token成本压到多少?
而海光展台这次亮出的双芯底座,本质上就是在回应这三个拷问。
首先是CPU+DCU分负载调度,通用计算和AI推理混跑时,海光C86管事务型负载,深算DCU专攻矩阵运算,物理隔离、逻辑协同,算力浪费压到个位数。
其次是生态兼容降迁移成本。主流AI框架和模型算子库开箱即用,从国外厂商切过来,移植周期压缩。
更重要的,全栈可控才有Token效益。从指令集、高速互联到调度软件,海光都是自研,没有黑盒组件,这对要求SLA 99.99%的行业是刚需。
可以预见,能算清楚Token效益账的算力厂商,在下一阶段会更占优势。因为企业客户已经不想再当冤大头了,算力堆了一堆,产出没见涨。谁能帮他们把算力真正转化成利润,谁就能拿到下一波订单。
海光信息 国产算力 智博会

