这几天,“算力”成了2024年全国两会上的热词。
目前,已经有多位全国人大代表围绕算力热词提出了相关议案,为接下来算力高质量发展带来新动力。与此同时,作为AIGC时代下的重要基础设施之一,算力基础设施也因算力进化至“下一站”,成为当下全球AI巨头们角逐的新“战场”。
(图源:itchronicles)
AIGC热潮下,算力需求迎来大爆发
新一代AI技术的崛起,为各行业多领域数实融合发展注入活力。在AI大模型的驱动下,当下算力可谓无处不在,几乎“触手可及”。
不论是ChatGPT类的文本生成式大模型,还是最新款Sora之类的文生视频大模型,其训练和推理都需要建立在巨大的参数量和运算量之上,因此对算力提出了极高要求。
目前而言,通过大量领域数据训练的大模型,已经可以在特定领域担任专家角色,提供智能咨询和决策支持。但下一步,持续迭代的大模型需要不断进化和“飞跃”,以实现单体到群体、理性到感性的升级,该过程中需要面对许多技术难题,其中最关键的就是算力基础设施对大规模计算提供的算力支持。
(图源:market.us)
据market.us调查数据显示,2023年全球算力市场的价值为457亿美元,预计到2032年将达到813亿美元。在2023年至2032年期间,该市场预计将以6.8%的复合年增长率增长。
就我国而言,去年发布的《中国人工智能计算力发展评估报告》数据也显示,2023年我国人工智能算力市场规模将达到664亿元,同比增长82.5%,人工智能算力需求快速增长。预计到2027年之前,我国智能算力规模年复合增长率将达33.9%,同期通用算力规模年复合增长率为16.6%。
看来,算力已经成为全球数字经济的增长引擎,而算力基础设施则成了当前全球AI巨头们角逐的新“战场”。
算力市场大“厮杀”,GPU芯片“一卡难求”
算力概念的提出,要追溯到2018年诺贝尔经济学奖获得者Wil⁃liam D.Nordhaus的《计算过程》一文,其中提到算力是设备根据内部状态的改变,每秒可处理的信息数据量。目前,业界通常将CPU、GPU等芯片技术及能力称为算力,因此芯片则成为了算力的代名词。
(图源:blog.techdesign)
简单来说,算力就是芯片的计算能力。常用的算力计量单位FLOPS是每秒执行的浮点数运算次数,算力数值越大代表综合计算能力越强。
算力也分多个种类,不同领域应用的数据和算法对算力的特性有不同的要求,所需的算力种类也不相同。
算力通常划分为通用算力、智能算力和超算算力三大类。通用算力主要是基于CPU芯片的服务器所提供面向基础通用计算的计算能力;智能算力主要是基于GPU、FPGA、ASIC等芯片的加速计算平台(服务器)提供面向人工智能训练和推理的计算能力;超算算力主要是基于超级计算机等高性能计算集群所提供面向科学工程的计算能力。
在AIGC崛起的当下,人们提到的算力类型,则大多是智能算力。智能算力是以GPU(图形处理器)、FP⁃GA(现场可编程门阵列)、ASIC(专用集成电路)芯片等输出的计算能力为主,通常采用半精度浮点数(FP16)计算能力来衡量。
目前,全球GPU芯片行业一直处于激烈竞争之中,高性能AI算力芯片可谓“一卡难求”。
作为行业巨头,英伟达(Nvidia)凭借其强大的CUDA软件平台和卓越的硬件性能一直占据着领先地位。AMD、英特尔和其他公司则紧随其后,多年来也在不断推出创新产品,特别是在生成式AI火热发展的当下,芯片巨头纷纷发力AI算力芯片领域,让该市场的“厮杀“愈发激烈。
在此过程中,作为AI大模型产业的重要基础设施之一,算力基础设施正在以GPU为核心为千行百业算力需求提供算力供给,其重要性不言而喻。
算力进化“下一站”:
算力基础设施高质量发展
算力基础设施主要包括数据中心、边缘计算中心等基础设施,依据算力类型的不同,数据中心又分为通用数据中心、智算中心和超算中心。其中,智算中心是专门进行智能计算,就是我们当下用于大火的AI、大模型训练等的数据中心。
(图源:analyticsindiamag)
业界常说“AI是把双刃剑”,AI驱动下的数字经济飞速发展是事实,而大规模AI技术的发展引发算力爆发,也给算力基础设施构建方面带来了新的发展思维。
此前,芯片巨头英伟达CEO黄仁勋就表示,当前人工智能已经达到“临界点”,而为了推动新软件的崛起,算力基础设施如数据中心的成本将在五年内翻倍。
据国际能源署(International Energy Agency)统计,训练一个AI模型所消耗的电力比100户家庭一年的用电量还多,而构成算力基础设施的数据中心和传输网络已经分别占全球能源消费的1.5%,它们每年排放的二氧化碳总量与巴西相当。看来,全球都关注到了算力基础设施的低碳高质量发展方面的问题。
其实在此之前,超大规模云服务提供商——如谷歌、微软和亚马逊等最大的数据中心所有者,都已经制定了“脱碳”目标,但随着AIGC的崛起,以上目标似乎受到了影响。
众所周知,作为AI大型语言模型崛起的关键,图形处理单元至关重要,但其实它却比其他形式的计算中使用的CPU消耗更多的电力。此外,人工智能的能耗波动较大,更类似于锯齿图,而非大多数数据中心运营商所习惯的平滑线,这也使得以上AI巨头们的“脱碳”目标成为一项挑战,更不用说确保电网稳定性了。
目前,大多数数据中心都力求在“稳定状态”下运行,这样它们的能耗就会相当稳定。科技巨头们也正在积极寻找机会,将其全球数据中心每日甚至每小时的运营转移,以吸收多余的可再生能源生产。
过去几年,我国算力基础设施建设经历了高速发展的阶段,算力规模已经接近全球的三分之一。这个时期,高质量发展将是算力进化的下一站。
对于我国而言,早在2020年9月就明确提出2030年“碳达峰”与2060年“碳中和”目标。“绿色发展是高质量发展的底色,新质生产力本身就是绿色生产力”,我国算力领域始终背靠“算力减碳”践行可持续发展。
随着算力需求的不断扩大,一系列利好政策的持续牵引,全行业多领域的倾力投入,目前我国在算力基础设施建设方面同样取得了不少成果。截至2023年6月底,我国算力总规模达到197EFLOPS,位居全球第二,近五年来年均增速近30%;服务器、计算机、智能手机等计算类产品产量全球第一;围绕算力枢纽节点建设130条干线光缆,数据传输性能大幅改善;算力应用广泛深入到政务、工业、交通、医疗等多个领域。
2023年10月份《算力基础设施高质量发展行动计划》的印发,再为我国当下算力需求爆炸新节点的进化指明了方向。除了进一步走向纵深的算力网络之外,不断盘活数据要素、释放算力价值,以此来驱动数字生产力的跃迁。
下一步,我国在算力基础设施方面的发展也将进一步升级,实现算力资源的高效使用,进一步加强运载力和存储力建设,以满足算力调度过程中实际的市场需求。
编辑 | MissD
关于以上话题,如果您也想参与讨论,不妨在评论区和我们一起交流互动~
欢迎联系转载原创内容!
转载请联系:
小 希:15701060895