加速计算是一种用于学术、研究和工程应用的计算方法。它通过利用专用处理器与传统CPU协同工作,实现更快的计算速度。由于加速计算将CPU和其他类型的处理器以相等的规模组合在一起,因此也称为异构计算。
GPU(图形处理单元)是使用最广泛的处理器。而DPU(数据处理单元)则代表了一类迅速兴起的处理器,其主要用途是增强和加速网络。这两种处理器与主机CPU一起协同工作,共同构建出统一且平衡的系统。相较于仅依赖CPU的系统,加速计算系统能够提供卓越的整体成本效益,并显著提高性能和能效。
加速计算技术起源于个人计算机领域,并在超级计算机的应用中逐渐发展成熟。它可用于个人电脑、智能手机和云服务。如今,现代商业和技术系统都采用加速计算来处理机器学习、数据分析、模拟和可视化等工作。
加速计算是如何发展起来的?辅助处理器是一种专门设计用于提升主机CPU性能的专用硬件,在计算机中的应用由来已久。它们的重要性可以追溯到大约1980年,当时浮点处理器的引入为个人电脑带来了先进的数学能力。在随后的十年中,视频游戏和图形用户界面的蓬勃发展推动了对图形加速器的需求激增。
1999年,英伟达(NVIDIA)推出了GeForce 256,这是一个具有重要意义的时刻。这款芯片开创性地采用四个图形管道进行并发处理,是首款专门设计用于从CPU卸载关键3D渲染任务的芯片。在此基础上,英伟达(NVIDIA)创造了“GPU”(图形处理单元)这一词汇,建立了一个新的计算机加速器类别。直到2006年,英伟达(NVIDIA)已成功出货5亿个GPU。与此同时,一些研究人员开始编写代码,利用GPU的强大功能来完成超出CPU能力的任务。在Lan Buck的领导下,他们引入了CUDA编程模型,旨在利用GPU中的并行处理引擎执行各种任务。2007年,CUDA与G80处理器合作,推出了一系列新的英伟达(NVIDIA)GPU,为不断扩展的工业和科学应用带来了加速计算。这一系列以数据中心为中心的CPU采用了包括Tesla、Pascal、Volta和Ampere等架构,并定期进行扩展。全球高性能计算领域的专家们运用GPU技术构建了加速HPC系统,取得突破性的科学研究。这些研究涉及的领域广泛,从黑洞的天体物理学到基因组测序等。
为什么加速计算很重要?现代加速计算和人工智能在人工智能时代,加速计算的重要性不言而喻,它是推动深度学习模型蓬勃发展的重要关键技术之一。在机器学习领域,模型训练是一项计算密集型任务。利用加速计算设备,尤其是GPU,可以显著缩短模型训练时间,加快算法迭代和优化过程。与此同时,人工智能也成为加速计算发展的重要推动力。例如,美国运通等公司利用人工智能技术预防信用卡欺诈,而电信公司则借助人工智能探索提供智能5G服务的可能性。
提高能源效率加速计算也有助于提高能源效率。CPU和其他专用加速器能够比通用CPU更高效地处理特定工作负载,通常可降低每次计算的功耗。例如,GPU在AI推理方面的能效是CPU的42倍。显然,将所有全球部署的AI服务器从纯CPU系统过渡到GPU加速系统,每年可节省10万亿瓦时的能源。这相当于每年约140万户家庭的能源消耗。
总结加速计算正在颠覆传统计算模式,开启一个创新的新时代。在人工智能和高性能计算领域,加速计算通常使用专用处理器(如GPU)来提高计算速度,并通过AI交换机连接和协调多个计算设备,以实现高效的数据交换和通信。加速计算技术将在人工智能、边缘计算、科学探索和医疗保健等领域产生深远影响,推动技术进步,释放曾被认为无法实现的潜力,并引领各领域的未来发展。
文章来源于