(1)、突破性的X86平台能效比;
(2)、出色的CPU核心性能
(3)、巨大的核显性能提升
(4)、卓越的AI算力 为此,英特尔为酷睿Ultra 200V打出的主宣传语为“一台伟大的AIPC始于伟大的PC”,表明了英特尔对于AI时代PC的全新定义:一台PC只有把基础功能做好,才能再去讨论AI。 那么英特尔酷睿Ultra 200V系列处理器的具体表现如何呢?我们按照上面的顺序一个一个来看 1、高达50%的整机功耗降低 作为英特尔口中“能效比最高的x86处理器”,同时也是Lunar Lake最显著特点,整机功耗最高降低幅度可以达到50%。 为了达成更低的功耗控制,在架构的设计方面,首先在内存上,前面已经提到,封装级内存使得物理功耗降低40%,Lunar Lake的Compute Tile中还额外加入了8MB的内存测缓存,可以更加高效的为内存密集型任务提供数据交换;其次在供电管理方面,PMIC整合式供电也起到了不小的作用,Lunar Lake中共有4颗PMIC对SoC上的各部分进行调压供电,可改善整机在低功耗或待机时的功耗情况,这也是x86平台一直以来在功耗控制方面的最大短板之一。能效核心上也有改进,相比于之前Meteor Lake时期两个LPE核心共享2MB L2缓存,Lunar Lake上的4个Skymont E核心共享4 MB L2缓存,本身能效就提高很多,更高的算力上限也可以实现更低的功耗控制。 英特尔线程调度器也是非常有必要单独拿出来说一下的,从12代大小核架构开始到首代酷睿Ultra,大小核心自登陆x86平台就有改善能效比的初衷在,但大小核心的调度与管理则是非常困难的一件事,对于相同架构,桌面端和高性能处理器用户对于功耗则没有多敏感,期望的是绝对的性能上限,而低压U用户则期望功耗压的越低越好,显然没有办法两头都兼顾,而Lunar Lake就不用考虑那么多了,是专门的低功耗平台,所以在线程调度上面就可以更加简单粗暴了。酷睿Ultra 200V的调度逻辑为优先使用单个E核,当需要更高负载时则扩展到其他E核,负载更高时才会根据需求调度到P核心,最大限度的利用E核心,减少功耗。 一套组合拳下来,整机功耗和续航方面有着怎样的表现呢? 首先来看整体功耗控制情况,在UL Procyon 的Office Productivity测试中,Ultra 9 288V在仅使用E核心时,相比于高通X1E-80-100有着7%的性能提升和49%的功耗降低,每W性能提升1.2倍;相比于上代Ultra 7 165H,有着7%的性能提升和53%的功耗降低,每W性能提升2.29倍。 在常用办公、日常使用场景中,对比Ultra 7 165H,Ultra 9 288V整体功耗下降最高可达50%。 到续航方面,英特尔官方给出了两组数据。在相同OEM提供的相同模具下,在UL Procyon Office Productivity测试与Microsoft Team 3x3场景中,Ultra 7 268V的续航时长可以达到20.1小时和10.7小时,而高通X1E-80-100则是18.4小时与12.7小时。 在相同OEM提供的14~16英寸屏幕的模具、1080P屏幕、75Whr的电池容量下,同样在UL Procyon Office Productivity测试与Microsoft Team 3x3场景中,Ultra 9 288V可以分别达到14小时和9.9小时的续航能力,而高通X1E-78-100的成绩为9.5小时与9.4小时,AMD HX 370的成绩分别为10.1小时和8.2小时。 游戏场景下的核显能耗也有很大的提升幅度,Ultra 9 288V的Xe2架构核显对比Ultra 7 165H的核显在《刺客信条:英灵殿》、《赛博朋克2077》、《模拟农场22》中,最高有68%的性能提升和35%的核显功耗下降。 Arm架构的高通骁龙X Elite处理器在能耗方面有着Arm架构带来的先天优势,但是通过上面的测试可以看到,x86架构的英特尔酷睿Ultra 200V甚至在续航表现上反超了高通骁龙X Elite,再加上x86架构更好的软件兼容性和生态,那么终端产品的真实使用场景下,英特尔酷睿Ultra 200V将会是追求低功耗表现上更好的选择了。 2、E核IPC提升68%,8核8线程强于14核心22线程 Lunar Lake的性能核心与能效核心皆有微架构的升级。 高性能核心微架构升级为Lion Cove,英特尔对于Lion Cove的介绍为:“为轻薄PC打造速度更快的性能核心”,最高12MB共享L3缓存,18个执行端口,更广泛的分配和撤离机制,对于性能、功耗、芯片面积有着针对性的平衡优化,IPC提升幅度为14%。 本代的Lion Cove并不支持超线程,不过在英特尔给予的数据中,我们可以看到,在关闭超线程后,Lion Cove可以达成更高的每瓦性能、芯片每单位面积性能、芯片每单位面积每功耗性能,以达成更优秀的能耗表现与性能表现还平衡了芯片规模。 在单线程基准测试中,在CINEBENCH R24、Geekbench 6.3、SPECrate 2017_int_base中,Ultra 9 288V均能提供相比高通骁龙X Elite的两款竞品X1E-78-100、X1E-80-100以及AMD的HX370更强的单线程性能。 高效能核心微架构升级为Skymont,英特尔对于Skymont的介绍为:“以高能效比迫近P核性能”,4MB共享L2缓存,26个调度端口,增强指令预测能力,拥有更深的队列提高任务并行处理能力、更广泛的指令分配和撤出能力以及2倍的AI吞吐量,IPC提升幅度达到惊人的68%。 具体到多核性能方面,在低功耗区间段内,凭借着极其优秀的能效比,Lunar Lake可以以8核心8线程的规格实现对规格更高的上代Meteor Lake产品完成性能反超。在功耗为9W时,4P+4E、8T的Lunar Lake性能领先2P+8E+2PE、14T的Meteor Lake 22%,每线程性能领先2.1倍;在功耗为17W时,4P+4E、8T的Lunar Lake性能领先6P+8E+2LPE、22T的Meteor Lake 10%,每线程性能领先3倍;在23W时,4P+4E、8T的Lunar Lake性能仅落后6P+8E+2LPE、22T的Meteor Lake 6%,每线程性能领先幅度为2.6倍。 在功耗性能曲线上,英特尔着重标记了Ultra 9 288V可以在减少40%功耗的情况下,达到高通X1E-80-100 50W功耗时的多核心性能性能表现;在大约20W功耗时,与苹果M3性能持平;在15W功耗以内时,领先Ultra 7 165U。 在生产力方面,Ultra 9 288V在五个维度的测试中,也领先于高通骁龙X1E-80-100和AMD HX 370。 通过更低延迟的总线,缩小了P核与E核间的访问延迟,内存则是再加上8MB内存侧缓存,内存延时被降低到了90ns左右,相比于Meteor Lake降低了40%,比Strix Point 降低了30%。 在保证高能效的前提之下,Lunar Lake并不是一个只考虑低功耗而放弃性能的架构,在全新的P核、E核以及内存、总线等等方面的优化和重新设计,Lunar Lake在低功耗段可以实现对更高规格处理器的性能超越,所以在它的目标使用场景,如办公、学习、网页浏览、在线视频等,可以处理比以往更繁重的工作负载,与此同时,更低的功耗、更高的能效比使得整块处理器的温度表现也会更好,在同等情况下,对于主板上周边元器件以及整机散热规格的要求也都更低,带来的是低发热量+更轻薄的机身尺寸,这也是为何酷睿Ultra 200V系列处理器是更适合放在超轻薄本产品中的重要原因之一。 3、再次跃升的核显性能 首代酷睿Ultra时,核显架构从之前沿用多代的Xe LP升级为了Xe LPG,性能已经有了相当大的进步,而Lunar Lake中的核显再次升级到了Xe2架构,拥有最高8个第二代Xe核心和8个光线追踪单元,内置了新的XMX矩阵引擎可为AI加速,可提供67 TOPS的AI算力,加之更出色的Xess内核,在游戏中可实现更高的帧数表现。 在45款游戏中,Ultra 9 288V的平均帧数表现超越Ultra 7 155H 31%;超越AMD HX 370 16%;高通X1E-84-100则是有23款游戏不能运行,在其余可运行的游戏中,Ultra 9 288V的平均帧数领先幅度达到68%。 英特尔的XeSS技术会让游戏帧数再进一步,目前市面上已经有120+款游戏支持XeSS。Ultra 9 288V相比于不开启XeSS,在XeSS的Performance挡位后,10款游戏中最高可以达成60%的帧数提升。 得益于8个全新的光追单元和对DX12 Ultimate的完全支持,开启光追后,5款游戏中,Ultra 9 288V开启Xess Performance挡位对比AMD HX 370在开启FSR Performance挡位时,帧数领先幅度最高可达30%以上。 媒体引擎也依然是英特尔处理器中核显的强项,在编解码方面的支持更加全面,最高支持8K 60 10bit HDR的硬件编解码、AV1格式硬件编解码、全新的VVC(H266)格式硬件解码,视频的转码速度上,竞品AMD HX 370以及高通X1E-78-100都远不及Ultra 9 288V。 从个人的角度来出发,对于Lunar Lake这种产品的目标适用人群和使用场景,图形性能其实并不是一个重要的配置点,哪怕是使用更老的图形架构、更低的规格,在办公和学习场景下其实都几乎不会造成什么影响,但英特尔在Lunar Lake上首发自家的Xe2图形架构其目的之一肯定是要“秀技术”,自从AMD将Vega、RDNA图形架构搬到移动端锐龙处理器后,英特尔酷睿的核显在游戏性能方面就一直落后,直到上代才勉强能掰掰手腕,而英特尔目前的境遇显然需要的是在各方面都要展现出自己的硬实力,对竞争对手实现全方位的领先,才能扭转这几年来不利于自己的市场因素。 另外,这样的核显也自然是有它价值所在和发挥场景的,就例如在Windows掌机中,虽然这并不是一个多么大的市场,但当前的Windows掌机大部分厂商由于能效比和图形性能的缘故都纷纷加入AMD阵营,甚至会去专门定制掌机芯片,比如ROG掌机上的Z1 Extreme。显然英特尔并不想将这部分拱手相让,市场份额和出货量是一方面,作为消费级处理器市场多年来的龙头,英特尔绝对不想在任何一个方面落得下风,Lunar Lake的高能效比以及图形性能的突破,非常适合放到Windows掌机中来使用,或许在这之后我们可以看到更多的厂商推出搭载英特尔酷睿处理器的Windows掌机了。 核显的媒体引擎则保持了英特尔一贯的优势,如果平常有轻度的视频剪辑需求,那么凭借着强大的媒体引擎,硬件编解码对视频格式有更广泛的支持,英特尔酷睿处理器就是一直以来在这方面更好的选择,这点依旧是没有变的。 4、120 TOPS算力 对于当下AI应用对CPU、GPU以及NPU的利用率,目前NPU占比25%,GPU占比40%,CPU占比35%,英特尔预测在2025年,NPU的利用率占比提高,CPU则会降低。一般情况下来讲,对于当下的AI应用,CPU虽然通用性更广,但是其算力对比GPU、NPU是更低的,所以如果能将AI计算负载从CPU逐渐转移到NPU与GPU,那么对于AI应用的运行速度、能效比等显然是更好的选择。 在Lunar Lake中,CPU算力为5 TOPS,GPU为67 TOPS,专用于AI计算的NPU单元为49 TOPS。 在常用的本地生成式AI应用Stable Diffusion 1.5(GIMP)中,Ultra 9 288V使用GPU(FP16)进行运算时.....没有对比,因为用来对比的高通X1E-78-100又一次的“DNR”了,而使用NPU(W8A16)时,Ultra 9 288V的速度更快一些。 在UL Procyon的AI Computer Vision测试中,Ultra 9 288V的int8性能得分1886分,FP16性能得分1017,高通仅能完成int8的测试,测试成绩为1760,AMD HX 370在两项测试中都无法完成。 在UL Procyon的AI Image Generation测试中,Ultra 9的FP16性能得分391,AMD HX 370为182,高通X1E-78-100无法完成。 在Geekbench AI项目测试,Ultra 9 288V在CPU、GPU和NPU的性能表现都断崖式的领先于竞争对手AMD HX 370和高通X1E-78-100。 实际应用中的表现,以Ultra 7 155H为基准,Ultra 9 288V也极大幅度的领先于竞品X1E-78-100。 在AI生态方面,英特尔对于大语言模型、多模态模型、扩散模型、框架的都有更好的支持,与ISV合作有着300+的ISV特性,拥有更好的兼容性、更快的引擎、更多的框架。 不仅仅是AI方面的生态,在创作、连接、娱乐、学习等诸多方面,英特尔酷睿平台都会以强大的硬件支撑来提供给用户更好的软件生态。 英特尔列出了其在Adobe软件Pr、Lr、Ae中部分功能的性能对比,与高通X1E-78-100和上代Ultra 7 155H的对比中,Ultra 9 288V也都有大幅度的领先,这得益于与合作伙伴更深层次的合作,可以在新硬件推出后第一时间给予优化支持。 四、写在最后 下面是我个人对于英特尔Lunar Lake架构酷睿Ultra 200V系列处理器的总结与想法。 从实际的产品出发,Ultra 200V系列处理器目标是提供x86平台更强生态的同时,为x86平台引入一直以来缺失的低功耗和高能效比,同时在性能方面完全满足办公与日常所需,这也确实相比于之前的x86产品更加适用于轻薄本平台,为差旅人士、办公人群、学生群体等提供更好的便携性、续航能力以及更低的发热量。 而从稍微宏观一点的角度来讲,酷睿Ultra 200V由于其更加专注于一类细分市场,它肩负起的任务并不是在市场测出货的多么风生水起,来给予英特尔更多的收入与利润,而是通过其富含的技术力来向投资者、OEM厂商、终端消费者以更大的信心在接下来还会选择和相信英特尔,它的出现最终要达成的更多的是让大众扭转近年来对于英特尔的负面情绪和认知。 所以如果说酷睿Ultra 200V可以“扶英特尔之将倾”,那么它的出现并不是将英特尔完全扶正,而是最多止住或减缓英特尔的继续倾斜,想要真正的“扶正”,还需更多的努力与时日。 9月24日,20+OEM厂商提供的80+款酷睿Ultra 200V机型已经蓄势待发,我们拭目以待! END