变革AIPC时代,这就是“骁龙本”的底气

三易生活 2024-03-07 19:21:09

众所周知,在如今的PC市场中,“AI PC”已经成为了最受关注的话题之一。

那么什么是AI PC?通俗来说,就是具备AI加速运算能力,可以不依赖云端算力、在本地执行AI计算的个人电脑。

体现在具体的实际功能上,这些AI PC通常都具备基于AI的影像和音频优化功能。比如可以自动改善摄像头和麦克风的清晰度、在视频会议中模糊背景、消除噪音。除此之外,一些算力更高的产品还可以基于AI来实现本地视频超分、照片快速处理,以及图文内容的自动生成等等。

当然,这些都还只是AI PC在表面上的功能表现。那么如果深入硬件架构的层面去观察,AI PC与普通电脑相比又有着怎样的差异呢?

NPU的优势到底是什么?它几乎可说是AI PC的核心

纵观目前已知的那些AI PC,不难发现它们在硬件层面都有一个共通点,那就是普遍具备“NPU”、这个此前在PC中很少见的计算单元。

何谓NPU,简单来说,它是一种专为标量、向量和张量运算而设计,具备仿生神经网络架构的特殊处理器。从架构层面来说,NPU就是专为AI计算而生的。

但这是否意味着,没有NPU的电脑就不具备运算AI代码、执行AI应用的能力呢?并非如此。实际上,早在AI PC这个概念出现之前,很多主流的CPU和GPU架构里就已经加入了可以提高AI计算效率的指令集,甚至是直接集成了属于它们自己的AI加速单元。不过,这些CPU和GPU的架构毕竟不是专门为了独立运行AI应用而设计。

而专门的NPU在AI应用的运行效率上会高很多。比如,一个N*N矩阵和另一个N*N矩阵相乘,需要读取2N²个值、并进行2N³次运算。对于带有张量加速器的NPU来说,它在这个过程中的内存读写次数,只需要总运算次数的1/N。换句话说,相比于传统的CPU和GPU,NPU在实际使用中所需的内存带宽要小得多,而且功耗也会低得多。

况且对于PC来说,它们在日常使用时,CPU和GPU的算力必然会主要被用于处理常规应用和游戏的需求。如果分出一部分来进行AI运算,不仅能效差、而且还会影响到“通用性能”。

大家都有在做NPU,但高通的规格却格外“出挑”

明白了“传统处理器”的劣势,就可以来聊聊如今在PC行业中,关于NPU的一些具体情况了。

首先,尽管我们前面讲到了NPU相比CPU、GPU,会有着显著的效率优势。但不同品牌、不同型号的NPU到了具体使用场景下,还是会有着很大的不同。

一方面,这源自于不同品牌处理器里,NPU算力上客观存在的巨大差距。比如我们大家都知道,现在市面上共有五款已量产的PC NPU方案,它们分别是算力7TOPs的Intel 3700VP(13代酷睿移动版的可选外挂NPU)、算力10TOPs的AMD 7000系集成APU、同样10TOPs的Intel Core Ultra处理器集成NPU、16TOPs的AMD 8000系集成APU,以及算力45TOPs的高通骁龙X Elite集成NPU方案。

很显然,相比于前几款10TOPs上下的NPU方案,骁龙X Elite的Hexagon NPU首先在基本的算力上就已经高出了好几倍。

另一方面,与其他NPU方案相比,骁龙X Elite集成的NPU还有一个很重要的优势,那就是它拥有深厚得多的技术积淀。

要知道,无论Intel还是AMD的NPU架构,最远也只能追溯到三四年前的服务器计算卡或AI“加速棒”。但是高通不同,早在2007年,他们就推出了首款搭载Hexagon DSP的骁龙平台。而这款带有标量计算架构的DSP,就正是后来高通NPU的基础。

此后在2013年,高通发布了业内首款独立NPU处理器,并在2015年的骁龙820上首度将AI引擎集成进了移动平台。之后到了2018年,骁龙855首次加入张量加速器NPU设计。而到了2019年的骁龙865上,它的端侧AI功能其实就已经很全了,包括AI成像、AI视频、AI语音和始终在线感知等功能,在那个时候其实就都已经实现。

到最近这两年,第二代骁龙8和第三代骁龙8里的Hexagon NPU更是引入了众多技术提升。其中包括专用的电源传输轨道、专门针对神经网络处理的微切片架构、将张量加速吞吐量提升了一倍的INT4运算支持,以及大幅加速生成式AI运算速度的Transformer网络加速能力等等。

优势巨大的软件适配,骁龙本有望重新定义AI PC

当然,光有算力、架构上的优势,并不一定就意味着实际使用里的体验差异。但高通作为移动平台NPU的先行者,本身在软件适配、AI计算解决方案上的积淀,实际上更是目前其他竞争对手所难以企及的。

比如,针对如今生成式AI大模型流行的趋势,高通很早就做出了应对。他们不仅在NPU本身的设计上进行架构适配,而且为旗下的旗舰移动平台设计了等效频率高达8533MHz、甚至9600MHz的内存控制器。以骁龙X Elite为例,它的8通道LPDDR5X内存带宽高达136.5GB/s,显著超过目前其他的笔记本电脑平台CPU产品,因此也更有利于对内存带宽依赖度很高的生成式AI创作。

又比如说,虽然前面有提及强调高通NPU的领先。但实际上,高通在自研的CPU和GPU架构中都加入了AI计算能力,而且可以通过旗下的高通AI软件栈,很轻松地帮助开发者实现跨处理器的异构AI运算部署。让CPU、GPU、NPU同时处理一个AI任务中的不同代码部分,以实现更高的效率和更短的响应时间。或者是让CPU、GPU、NPU在同一时间,分别处理不同类型的AI应用。

除此之外,就在近日,高通方面也正式发布了《通过NPU和异构计算开启终端侧生成式AI》技术白皮书。其中高通不仅详述了自家NPU技术的历史,而且专门针对AI异构计算、跨设备AI应用移植等做出了阐释。

与此同时,他们也再次高调宣传了自家的“AI Hub”开发者网站。通过它,无论是手机、PC、汽车中控,还是XR设备的开发者,都能更简单地实现AI应用的开发和性能优化,以及跨平台的适配,从而大幅加速端侧AI应用落地的速度。

值得关注的是,根据目前的已知信息显示,骁龙X Elite不仅很可能是目前唯一满足下一代Windows操作系统大版本更新中对于NPU性能需求的PC平台,而且它还已经得到了包括Adobe“全家桶”在内的一系列专业生产力软件支持。从这一点来说,虽然搭载它的终端还没有正式上市,但其很可能即将成为AI PC在人工智能交互和生成式AI专业生产力方面的全新标杆。

1 阅读:41

三易生活

简介:专注IT,最快最专业资讯!