DC娱乐网

Agent时代谁还不懂Tokens?华为云“零售”战略转向说明了一切! 就在英

Agent时代谁还不懂Tokens?华为云“零售”战略转向说明了一切! 就在英伟达H20芯片滞销停产、供应链全面收缩之时,华为云已经率先跳出“硬件军备竞赛”的思维,转向一场更加根本的算力供给模式:Tokens服务。 这不再只是一款芯片的成败,而是一场从“卖卡”到“卖电”的范式转移——AI时代的基础设施竞争,已彻底换道。 国家数据局的数据令人震撼:一年半时间,中国日均Tokens消耗量从1000亿暴涨至30万亿,增速高达300多倍。推动这一现象的是Agent智能体的普及。这些“数字员工”正在重塑企业工作流,但它们渴望“电力”——也就是Tokens。 正如工业革命离不开电,AI时代也离不开Tokens。它正在成为“第五种能源”。 华为云的策略非常明确:不再仅仅面向政企大客户“整卡批发”,而是转向做“普惠式”Token服务。 今年3月推出Tokens服务,8月全面接入自研CloudMatrix384超节点,通过xDeepServe架构创新,单芯片最高可实现2400TPS、50msTPOT的超高吞吐、低时延的性能,达到业界新高,是H20的3倍。 这让小团队每月只需几千元,就能用上超节点算力;让传统工厂,不需自建机房、不聘算法团队,也能低成本接入AI升级——华为云正在把算力从“奢侈品”变成“日用品”,正如百年前电网的普及,彻底降低了电力的使用门槛。数据则更为直观,据了解,华为云的整体算力规模相比去年同期增长率接近250%,使用昇腾AI云服务的客户从去年的321家增长到今年的1714家,增长超过400%。 但这只是开始。 华为云的真正野心,是构建一个跨超节点、跨模型的“算力调度网络”。当前,xDeepServe已实现单节点内Attention、FFN、MoE组件的“拆分调度”,下一步是实现多超节点之间的动态流量分配,让算力像电一样“即插即用、无缝流转”。 华为云MaaS服务已支持DeepSeek、Kimi、Qwen、Pangu、SDXL、Wan等主流大模型及versatile、Dify、扣子等主流Agent平台,推动“算力电网”进入各行各业。 据了解,华为云已经为央国企、智能驾驶、大模型、互联网、消费电子、具身智能等众多行业客户提供了极具竞争力的算力服务。国内头部金融机构依托昇腾算力,日均可稳定运行超1000个智能体应用。 H20的退场,象征着一个旧时代的终结,。而华为云的Tokens服务战略,则清晰指向一个新的方向:中国AI的未来,不靠别人的芯片施舍,而靠自己的架构创新、调度能力与生态决心。 当算力真正成为如电一般流动的能源,AI普惠时代才会真正到来。