全球计算能力危机迫在眉睫,我们目前的处理方式无法持续解决这个问题。
简而言之,在人工智能(AI)模型呈指数级增长和正在进行的全球数字化转型之间,数据中心的空间正在耗尽。它们的空置率正创下历史新低,价格也在因需求而上涨,这让科技行业的领导者感到非常不安。
如果这种趋势继续下去,在某个时刻,我们将达到一个临界点,我们处理数据的能力将受到限制。也许最大的担忧是,我们刚刚开始挖掘的人工智能的变革潜力,将被纯粹的物理限制所遏制。
这将阻碍新的发现和更先进的机器学习(ML)模型的发展,这对所有人来说都是坏消息,除了人工智能末日的危言耸听者。
有没有办法避免计算能力危机?
由于大规模缩减我们的计算需求并不是一个真正的选择,唯一的选择是显著提高容量,这归结为两个可用的行动方案:建立更多的数据中心和开发更好的数字基础设施。但这说起来容易做起来难,原因如下:
建立更多的数据中心?
到目前为止,对计算能力不断增长的需求,部分是通过建立更多的数据中心来满足的,保守估计,数据中心占用的房地产每年增长约40%。这个数字可以保持相当稳定,因为供应问题、电力挑战和施工延误严重限制了规模的扩张。
换句话说,今天的需求不能简单地通过增加数据中心建设来满足。
这也不应该是我们所渴望的。这些足球场大小的仓库消耗了大量的能源和水,给当地和全球的环境造成了严重的压力。一个数据中心消耗的电力和水相当于5万个家庭的用电量,云计算的碳足迹已经超过了航空业。
另外数据中心在尽量减少对环境的影响方面取得了不错的进步。这在很大程度上要归功于可持续发展政策的持续推进,它推动了创新,特别是在制冷和能源效率方面。如今,我们会发现数据中心建在地下矿井、海洋中,并利用其他自然冷却机会,如峡湾水流,所有这些都是为了减少能源和水的消耗。
问题是,这并不能在全球范围内推广,也不是一个可行的前进道路。建立更多的数据中心——无论效率如何——将继续对当地生态系统造成严重破坏,并阻碍国家和国际可持续发展的努力。尽管如此,仍然无法满足对计算资源的需求。
开发更好的数字基础设施?
所有的希望都寄托在改进数字基础设施上,即芯片、交换机、电线和其他可以提高数据速度和带宽,同时消耗更少能量的组件。人工智能的发展取决于找到在不消耗更多能源的情况下传输更多数据的方法。
本质上,这意味着两件事。首先,开发更强大、以人工智能为中心的芯片。二是数据传输速度的提高。我们继续往下聊:
1. 为人工智能设计定制芯片
现有的数字基础设施并不特别适合ML模型的高效开发。通用中央处理单元(CPU)仍然是数据中心的主要计算组件,由于缺乏专业化和计算效率,它们难以处理人工智能特定的任务。
在人工智能方面,图形处理单元(GPU)的表现要好得多,这要归功于更好的处理能力、更高的能效和并行性。这就是为什么每个人都在抢购它们,这导致了芯片短缺。
然而GPU不可避免地会遇到同样的问题。它们本身并没有针对人工智能任务进行优化,导致在处理现代人工智能应用程序日益复杂和数据密集型的需求时,能源浪费和性能不佳。
这就是为什么IBM等公司正在设计针对人工智能计算需求量身定制的芯片,这些芯片将在最大限度地提高性能的同时,将能耗和空间降至最低。
2. 提高数据传输能力
没有一个现代人工智能模型是在单个芯片上运行的。相反,为了获得最多的可用资源,可以将多个芯片组装到集群中。这些集群通常构成较大网络的一部分,每个网络都为特定的任务而设计。
因此,互连,或促进芯片,集群和网络之间通信的系统,成为一个关键的组成部分。除非它能跟上系统其余部分的速度,否则它有可能成为阻碍性能的瓶颈。
数据传输设备所面临的挑战反映了芯片所面临的挑战:它们必须以高速运行,消耗最少的能量,并占用尽可能少的物理空间。
随着传统的电子互连在带宽和能源效率方面迅速达到极限,所有的目光都集中在光学计算——尤其是硅光子学上。
与电子系统不同,光学系统使用光来传输信息,这在物质领域提供了关键优势——光子信号可以以光速传播,并携带更高密度的数据。此外,光学系统消耗更少的功率,光子元件可以比电子元件小得多,从而允许更紧凑的芯片设计。
对于光学计算实现更高的数据传输,这里的关键词是“可以”。然而光学计算科技的成长仍然有其“烦恼”。
光计算虽然非常快速和节能,但目前面临着小型化、兼容性和成本方面的挑战。
光学开关和其他元件可能比电子元件更笨重、更复杂,这给实现同样水平的小型化带来了挑战。到目前为止,我们还没有找到既可以作为有效的光学介质,又可以扩展到高密度计算应用的材料。
数据中心通常针对电子,而不是光子,处理进行优化,并且将光学组件与现有电子架构集成是一个重大挑战。此外,就像任何尖端技术一样,光学计算还需要在该领域证明自己。对于光学元件的可靠性也是关键考核指标之一,特别是在数据中心环境中典型的高负载、高应力条件下,研究严重缺乏。
最重要的是,光学元件所需的特殊材料非常昂贵,这使得广泛采用光学元件的成本可能过高,特别是对于小型数据中心或预算紧张的数据中心。
所以,短期内解决计算能力危机的最佳办法是不会停止建设数据中心。如果有什么安慰的话,我们知道科学家和工程师们非常清楚这个问题,并通过不断突破边界,在数据中心优化、芯片设计和光学计算的各个方面取得重大进展,努力寻找不会破坏地球的解决方案。
我们面临着严峻的挑战,为了让现代技术充分发挥其潜力,我们必须直面这些挑战。
喜欢点赞收藏!欢迎关注SevenTech!