别人发新品:提前半年预热; 华为发模型:刚刷到消息,代码已经下完了,这手速
手机测评团
2025-07-02 20:03:36
别人发新品:提前半年预热;
华为发模型:刚刷到消息,代码已经下完了,这手速,是麒麟芯片在加速下载吧?
华为盘古72B混合专家模型悄然开源,这个开源与其说是模型,不如说是效率的标杆!
盘古72B混合专家模型,参数720亿,推理时只激活160亿,单卡吞吐1528 token/s 最高。
盘古7B模型回答简单问题时如同开了挂,复杂问题时进入“慢想”模式,完爆GLM4-9B等大型模型。
有人说华为开源太晚了,但昇腾超节点架构的MFU训练千亿模型,已经达到了45%的效率,训练速度如同高铁提速到200迈!
网友说:这哪是三室一厅交一居室电费?分明是买了自行车的钱,到手发现是辆能飙到300码的超跑!
此次开源盘古72B混合专家模型,为计算需求极高的金融风控、工业传感等场景带来了新的机遇。边缘设备也能跑大模型。
华为开的不是源,而是心!
对此,你有什么想说的呢?
0
阅读:5