变革AIPC时代，这就是“骁龙本”的底气

众所周知，在如今的PC市场中，“AI PC”已经成为了最受关注的话题之一。

那么什么是AI PC？通俗来说，就是具备AI加速运算能力，可以不依赖云端算力、在本地执行AI计算的个人电脑。

体现在具体的实际功能上，这些AI PC通常都具备基于AI的影像和音频优化功能。比如可以自动改善摄像头和麦克风的清晰度、在视频会议中模糊背景、消除噪音。除此之外，一些算力更高的产品还可以基于AI来实现本地视频超分、照片快速处理，以及图文内容的自动生成等等。

当然，这些都还只是AI PC在表面上的功能表现。那么如果深入硬件架构的层面去观察，AI PC与普通电脑相比又有着怎样的差异呢？

NPU的优势到底是什么？它几乎可说是AI PC的核心

纵观目前已知的那些AI PC，不难发现它们在硬件层面都有一个共通点，那就是普遍具备“NPU”、这个此前在PC中很少见的计算单元。

何谓NPU，简单来说，它是一种专为标量、向量和张量运算而设计，具备仿生神经网络架构的特殊处理器。从架构层面来说，NPU就是专为AI计算而生的。

但这是否意味着，没有NPU的电脑就不具备运算AI代码、执行AI应用的能力呢？并非如此。实际上，早在AI PC这个概念出现之前，很多主流的CPU和GPU架构里就已经加入了可以提高AI计算效率的指令集，甚至是直接集成了属于它们自己的AI加速单元。不过，这些CPU和GPU的架构毕竟不是专门为了独立运行AI应用而设计。

而专门的NPU在AI应用的运行效率上会高很多。比如，一个N*N矩阵和另一个N*N矩阵相乘，需要读取2N²个值、并进行2N³次运算。对于带有张量加速器的NPU来说，它在这个过程中的内存读写次数，只需要总运算次数的1/N。换句话说，相比于传统的CPU和GPU，NPU在实际使用中所需的内存带宽要小得多，而且功耗也会低得多。

况且对于PC来说，它们在日常使用时，CPU和GPU的算力必然会主要被用于处理常规应用和游戏的需求。如果分出一部分来进行AI运算，不仅能效差、而且还会影响到“通用性能”。

大家都有在做NPU，但高通的规格却格外“出挑”

明白了“传统处理器”的劣势，就可以来聊聊如今在PC行业中，关于NPU的一些具体情况了。

首先，尽管我们前面讲到了NPU相比CPU、GPU，会有着显著的效率优势。但不同品牌、不同型号的NPU到了具体使用场景下，还是会有着很大的不同。

一方面，这源自于不同品牌处理器里，NPU算力上客观存在的巨大差距。比如我们大家都知道，现在市面上共有五款已量产的PC NPU方案，它们分别是算力7TOPs的Intel 3700VP（13代酷睿移动版的可选外挂NPU）、算力10TOPs的AMD 7000系集成APU、同样10TOPs的Intel Core Ultra处理器集成NPU、16TOPs的AMD 8000系集成APU，以及算力45TOPs的高通骁龙X Elite集成NPU方案。

很显然，相比于前几款10TOPs上下的NPU方案，骁龙X Elite的Hexagon NPU首先在基本的算力上就已经高出了好几倍。

另一方面，与其他NPU方案相比，骁龙X Elite集成的NPU还有一个很重要的优势，那就是它拥有深厚得多的技术积淀。

要知道，无论Intel还是AMD的NPU架构，最远也只能追溯到三四年前的服务器计算卡或AI“加速棒”。但是高通不同，早在2007年，他们就推出了首款搭载Hexagon DSP的骁龙平台。而这款带有标量计算架构的DSP，就正是后来高通NPU的基础。

此后在2013年，高通发布了业内首款独立NPU处理器，并在2015年的骁龙820上首度将AI引擎集成进了移动平台。之后到了2018年，骁龙855首次加入张量加速器NPU设计。而到了2019年的骁龙865上，它的端侧AI功能其实就已经很全了，包括AI成像、AI视频、AI语音和始终在线感知等功能，在那个时候其实就都已经实现。

到最近这两年，第二代骁龙8和第三代骁龙8里的Hexagon NPU更是引入了众多技术提升。其中包括专用的电源传输轨道、专门针对神经网络处理的微切片架构、将张量加速吞吐量提升了一倍的INT4运算支持，以及大幅加速生成式AI运算速度的Transformer网络加速能力等等。

优势巨大的软件适配，骁龙本有望重新定义AI PC

当然，光有算力、架构上的优势，并不一定就意味着实际使用里的体验差异。但高通作为移动平台NPU的先行者，本身在软件适配、AI计算解决方案上的积淀，实际上更是目前其他竞争对手所难以企及的。

比如，针对如今生成式AI大模型流行的趋势，高通很早就做出了应对。他们不仅在NPU本身的设计上进行架构适配，而且为旗下的旗舰移动平台设计了等效频率高达8533MHz、甚至9600MHz的内存控制器。以骁龙X Elite为例，它的8通道LPDDR5X内存带宽高达136.5GB/s，显著超过目前其他的笔记本电脑平台CPU产品，因此也更有利于对内存带宽依赖度很高的生成式AI创作。

又比如说，虽然前面有提及强调高通NPU的领先。但实际上，高通在自研的CPU和GPU架构中都加入了AI计算能力，而且可以通过旗下的高通AI软件栈，很轻松地帮助开发者实现跨处理器的异构AI运算部署。让CPU、GPU、NPU同时处理一个AI任务中的不同代码部分，以实现更高的效率和更短的响应时间。或者是让CPU、GPU、NPU在同一时间，分别处理不同类型的AI应用。

除此之外，就在近日，高通方面也正式发布了《通过NPU和异构计算开启终端侧生成式AI》技术白皮书。其中高通不仅详述了自家NPU技术的历史，而且专门针对AI异构计算、跨设备AI应用移植等做出了阐释。

与此同时，他们也再次高调宣传了自家的“AI Hub”开发者网站。通过它，无论是手机、PC、汽车中控，还是XR设备的开发者，都能更简单地实现AI应用的开发和性能优化，以及跨平台的适配，从而大幅加速端侧AI应用落地的速度。

值得关注的是，根据目前的已知信息显示，骁龙X Elite不仅很可能是目前唯一满足下一代Windows操作系统大版本更新中对于NPU性能需求的PC平台，而且它还已经得到了包括Adobe“全家桶”在内的一系列专业生产力软件支持。从这一点来说，虽然搭载它的终端还没有正式上市，但其很可能即将成为AI PC在人工智能交互和生成式AI专业生产力方面的全新标杆。

DC生肖网

变革AIPC时代，这就是“骁龙本”的底气

三易生活