英特尔大胆回退至8核8线程:LunarLake性能测评揭秘,颠覆式变革背后的意图是什么?

小A之家 2024-06-11 10:29:55

在才结束的2024台北电脑展(COMPUTEX)期间,英特尔公布了下半年会登场的新款轻薄本处理器Lunar Lake——这绝对是令人震惊的一代产品,因为它取消了使用多年的超线程技术,从当下笔记本用主流酷睿处理器至少8核12线程,至多24核32线程的状况,“退回”到了4大核+4小核共8核8线程!而且,它还把内存焊到了处理器整体封装中!

如此大的变化,意欲如何?如此操作的背后又有着什么故事?来听听小A的科普和八卦吧!

■本文先简单直白地解读Lunar Lake的规格、特性、性能和价值。

■然后,回答一个重要问题:英特尔为什么要如此设计?以及背后的一些故事和背景。

看到这里,大家的第一反应可能是:我K,第一代酷睿Ultra(Meteor Lake)手都还没捂热,Lunar Lake就要来了?是的,它不仅要来了(今年下半年上市),而且还玩了一把“再度颠覆”:

●“低功耗小核”(LPE)又没了,Lunar Lake仅使用大核+小核(P核+E核)的设计;

●取消了沿用多年的超线程技术;

●核心数爆减到8个,4P+4E,一共也就8线程;

●然后,把内存颗粒和处理器绑一起了——处理器整体封装包含了内存!

这要换在七八年前,每一个变化都能支撑起一代更新,并号称“革命性变化”,如今一口气全祭出来,的确令人震惊——而且前提是,从代与代的变化来看,酷睿Ultra其实是相当成功的,集显性能大涨,处理器日常应用功耗也降低不少进而带来续航的明显提升。Lunar Lake却又来一次彻底颠覆,处理器核心数量和线程甚至“严重倒退”,英特尔是何用意呢?

先从技术层面说说Lunar Lake的设计方向,它是典型的为PC的AI应用大方向服务的,同时将带来更低的日常应用功耗,整机续航会再度大幅提升!而且,以上变化有制程、工艺和架构的巨幅提升作为支撑!

●先从最直观的内存变化说起:把内存焊在处理器整体封装上,好处是电路更短,且主板整体面积可减小250平方毫米。按照英特尔说法,可在“内存相关物理层省电最多40%”(很多媒体直接说“省电40%”是不准确的)。

另外,Lunar Lake支持的内存规格达到了惊人的LPDDR5X 8533,行业领先。容量方面则是16GB/32GB两种容量可选——但我猜大部分机型都会选择32GB,毕竟按正常逻辑来说,Lunar Lake轻薄本上将不会再有内存插槽可供升级了。

对了,八卦一嘴:其实“绑定内存”的做法并不是英特尔首创,大家可看看苹果M2处理器的图^__#。都说苹果M处理器的笔记本续航长,这就是其中一个道理啦。

●制程工艺再度提升!

英特尔酷睿处理器现如今还有不少是10nm制程,而轻薄本的第一代酷睿Ultra算是率先提升到了7nm+5nm+6nm的制程水平(CPU部分7nm(Intel 4),Arc Graphics集显为台积电5nm,控制和IO模块为台积电6nm)。

而Lunar Lake则再度巨变:一方面是全部采用台积电工艺;另一方面,制程再度提升:控制模块依然采用6nm制程(台积电N6工艺),但CPU+GPU+NPU的计算模块则采用了台积电的N3B工艺,也就是直接提升到了3nm制程!

而常识就是:制程的跨代提升,意味着可以设计全新的架构,带来更强的性能,同时还能进一步降低功耗。实际情况也正是如此,让我们继续往下看▼:

▲这个大图可以看清Lunar Lake的计算模块内部结构。

●大核(性能核)Lion Cove性能提升14%。

具体的内部架构变化、各种细部单元的提升就不赘述了,大家记住“效果”就好:按照英特尔的说法,相对于第一代酷睿Ultra的大核(Redwood Cove),Lunar Lake的大核(Lion Cove)的IPC性能平均提升了14%!

●小核(能效核)Skymont性能提升68%!?

同样,关于小核具体的内部架构变化、各种细部单元的提升就不赘述了,我们只看效果。按照英特尔的说法,相对于酷睿Ultra的小核(Crestmont),Lunar Lake的小核(Skymont)的整数IPC性能平均提升了38%!浮点IPC性能更是平均提升了68%之多!!

不过,这里有个细节要提醒大家:仔细看上面的官方PPT,会发现Lunar Lake的小核对比的其实并不是酷睿Ultra的小核,而是LPE核,即那两颗“低功耗小核”(酷睿Ultra是P核+E核+2颗LPE核构成的)。图片右侧的“多线程整数性能对比”曲线图,也提到了是“酷睿Ultra的2颗LPE核”对比“Lunar Lake的4颗E核”,所以,最大性能为4倍,集合上全新架构和制程的大幅提升,倒也不是太吃惊——但!在相同功耗上性能为2.9倍,以及在相同性能上,4个E核的功耗仅为酷睿Ultra 2颗LPE核功耗的1/3,这就相当厉害了!至少PPT是这样展示的,实际效果如何,得等正式发布后测试!

总之,从目前公布的官方信息来看,Lunar Lake的CPU大核和小核,性能提升的幅度是非常明显的,而且也明显更省电,甚至可说是相当省电!

这里又八卦一嘴,英特尔其实在英文资料中还公布了Lunar Lake的小核和Raptor Cove的对比,号称平均IPC提升了2%!有兴趣的朋友可以查一下Raptor Cove是什么^__#。再度提示:Lunar Lake仅是轻薄本处理器。

●必须提到的性能调度模式变化:先小核再大核。

有大核,有小核,就存在“如何调度,才能提升性能或能效”的问题。这里就涉及到英特尔的硬件线程调度器。具体的细节不解释了,只从宏观思路上给大家梳理一下:

·以前的各代大小核酷睿,思路往往是“有负载了,大核先上,求得最高性能和效率;如果有更多任务并行,再考虑把不那么紧急或低负载应用转移到E核或LPE核上”。

·而Lunar Lake由于E核够强,所以把思路“倒了过来”:有负载首先调用的是单个E核,如果能正常完成工作就用它了;如果需要更多性能时,则调动其他E核一起干活儿;如果需要强力并行计算时,再转向大核!这样做的指导思路就是尽可能降低处理器的整体功耗——毕竟,以轻薄本而言,绝大部分是轻量级的网页、多媒体和办公应用,其实无需大核出手!用E核又高效又低功耗地完成是更好选择!

●集显性能提升,效能似乎惊人!?

随着大量日常应用利用GPU加速,甚至干脆是GPU运算,硬件厂商都意识到,在轻薄类机型上,提升集显(GPU)的性能和功能,价值非常显著!所以,Lunar Lake上,全新的Xe2 GPU诞生了。

这里我们依然不赘述细节,只看性能呈现。但大家要注意,官方PPT中“优于第一代酷睿Ultra GPU性能1.5倍”,并没明确说是酷睿Ultra H还是酷睿Ultra U——要知道这两者的GPU性能相差巨大,前者的Xe核心为7个和8个,而后者只有4个。

另外还有个点有点吃不准——虽然集显制程从第一代酷睿Ultra平台的5nm提升到了3nm,核心也是新的Xe2,但官方对比曲线中,Xe2和酷睿Ultra H(Xe1)的“同性能下功耗差异”会不会过于夸张了呢?毕竟酷睿Ultra的GPU跑满也就20多W,难道Xe2只要一半功耗就能追平?会不会过分优秀了(当然我倒是期待如此优秀^__^)?最终答案只有等到上市后测试来解答啦。

●视频解码能力增强,Youtube超清视频功耗近减半!

这里还要提到全新的媒体和显示(成像)引擎。和绝大部分消费者紧密相关的是多媒体解码部分,也就是媒体引擎。Lunar Lake优化了AV1的硬件编码解码能力,并提供了VVC的硬解码能力。

在DEMO区看到了Lunar Lake和Meteor Lake的视频播放功率对比,同样播放AV1编码的视频,Lunar Lake的功耗(我猜是整机除了屏幕外的功耗)几乎低一倍!那么现实应用中的意义是什么呢?答案是:Youtube上,8K视频(比如很多风景片)都采用AV1编码,如果你用笔记本在线看,整机的续航可以大幅提升!

▲而VVC解码则实现了“从软解到硬解的质变”。会场中演示了对应的功率差异:第一代酷睿Ultra靠CPU软解,处理器封装功耗高达37.4W;而切换到Lunar Lake的硬解码后,CPU功耗狂降10多倍至2.8W!

●性能提升至四倍的NPU。

这两年AI应用被热炒,英特尔也祭出了AI PC概念,并宣布2024为AI PC元年。而从目前的情况来看,业界似乎认定NPU是AI PC的重要一环——因为它可以用更低的功耗代替CPU和GPU实现特定的AI应用。

但坦率说,第一代酷睿Ultra平台的NPU性能孱弱,基本是“结构性存在”。但在Lunar Lake上,NPU得到了大幅加强!

注意,当前市面上的第一代酷睿Ultra的NPU被称为NPU3(有兴趣的朋友可以去查一下NPU1和NPU2是什么,这里不介绍了),所以,Lunar Lake的NPU被称为NPU4。相对于NPU3,它的一个巨大变化是采用了三倍的神经计算引擎,即6个神经计算引擎(NPU3为2个),而其整体AI算力提升到了48TOPS(每秒可进行48万亿次操作)。

▲这个曲线对比很直观:同功耗下,NPU4相对NPU3有两倍性能;而最高性能达到了NPU3的四倍。

▲而提到AI算力,这里再总结一下Lunar Lake的平台整体算力:CPU的AI算力5 TOPS,GPU 67 TOPS,NPU 48 TOPS,平台合计AI算力达到了120 TOPS。

至于Lunar Lake的其他特性,诸如整合了WiFi7、多达3个雷电4接口、4个PCIe5.0和4个PCIe4.0等,这里就不赘述了。下面这张图比较好的归纳了Lunar Lake的特性▼

简单归纳Lunar Lake要点如下:

·将内存封装进了处理器单元,最大32GB容量LPDDR5x 8533;

·取消了超线程,4大核+4小核/8线程;

·大小核都采用了全新设计,性能增幅大,且在对比上代产品时,相同性能时功耗大幅降低;

·全新的调度器进一步提升了效能,降低了日常应用的平台功耗;

·当然还有更多设计服务于功耗的降低:比如更小的外频单位;以及全新的PMIC供电架构。

·新款Xe2核心集成显卡,性能提升,功耗降低;

·多媒体解码性能进一步提升,也有助于功耗的降低;

·全新NPU的规格和AI性能大幅提升,相比上一代,同功耗下实现两倍TOPS性能,最大TOPS性能达到4倍。

全面解读Lunar Lake的“技术层面”后,接下来的问题就是,英特尔为什么要采用这样颠覆性的设计?毕竟核心数量大减和取消超线程,从宏观来看,在大众消费层面的解释成本极高!

虽然定义为轻薄本处理器,并非性能向的产品,但在这个“16线程都嫌少,(CPU线程)框框越多越令人兴奋”的大环境中,大刀猛砍处理器数量,还取消超线程,给普通消费者解释起来是比较痛苦的——因为在普通消费层面,复杂的电脑配置往往会简化为“14核/20线程(或12核/16线程、24核/32线程)+32GB+16’’2.5K高刷”一句话。现如今变成了“8核8线程”,不懂的人肯定会觉得“这是啥超低端配置啊”……

▼而以下所有,就属于小A“八卦”范畴啦,并非“官方标准答案”!

小A认为英特尔这一颠覆性设计的主要原因是“基于竞争大环境的考量”。

正如前面提到的,采用“P核+E核+LPE核+NPU复杂架构”的Meteor Lake,即第一代酷睿Ultra其实从GPU性能提升、整体平台功耗的降低、整机续航的提升上,相对于之前各代酷睿其实是非常显著非常成功的!正常情况下,按部就班的推进就好。而Lunar Lake完全颠覆,必然是基于“更大的状况”,即竞争大环境——高通进军笔记本尤其是AI PC的力度非常大(有兴趣的朋友可自行了解下),而老对手AMD的步伐也相当快!谁都不想在全新的AI PC较量中落后!

也正因为这样,Lunar Lake放弃了英特尔自造,直接冲了台积电3nm工艺;也正因为这样,Lunar Lake将更多精力放在了“降低功耗、提升能效”上,制程的提升,砍掉超线程,都有助于“节能”或者说“提升能效比”。毕竟,高通的处理器是ARM架构,功耗低续航长是先天优势——x86处理器要想在功耗和续航上与它正面刚,必须有所舍弃!

很显然,在大量日常应用都开始利用GPU加速甚至GPU运算的当下,稳定提升GPU的性能是非常重要的;而高性能的NPU则是“战未来”,所以,Lunar Lake对CPU部分“下狠手”就容易解释了。

那为什么要大幅提升NPU性能呢?“战未来”的说法有依据吗?

之前小A曾经说过,基于小规模独立软件开发商的AI应用推广是相当难的。当下国内有不少特定领域的AI应用,但因为都是基于云端的,且没有大资金用于宣传,所以“大众看不到,不知道”。那部署在电脑上做成本地化AI呢?就更难了!电脑上能部署的AI模型不可能太大,效果可能会打折扣,还存在难以升级的问题!另一方面,即便本地部署,谁来买单?PC厂商预装后用户自己选择订阅付费?还是PC厂商买单后,以提升整机售价的形式转嫁给消费者?那多少钱合适?另外,你占据了硬盘空间,消费者不喜欢用不着又咋办?无论哪种形式,都有不完善和难以解决的问题!

但从全球宏观层面来看,处于垄断地位的微软则丝毫没有推广问题!而它与AI大佬OpenAI的“深度绑定”(微软的AI助手Copilot基于OpenAI的GPT,而GPT又是运行在微软的Azure云端算力上的),铸就了Copilot AI功能的飞速发展,功能越来越强。加上Office 365也可调用Copilot进行各种办公智能辅助,所以,微软Copilot正在成为全球(尤其是发达国家和地区)越来越多PC用户的AI应用首选——实际上用户根本不用选,因为新款笔记本上就自带Copilot按键,一键直达!

再说简单点就是:在PC的通用型AI应用层面,从目前的趋势来看,Copilot大概率是最大赢家!所以,英特尔AMD高通,都得与微软深度合作。而微软定义的Copilot+ PC,就提到了必须采用CPU+GPU+NPU的硬件形态。

且恰好,在与高通合作的Copilot+ PC上,微软推出了多款强势的本地AI应用,包含“Recall”(见上图)、“进阶版画图”和“实时字幕”——这仨应用都可离线运行,且都是运行在NPU上的。而一个官方宣传视频中,出现了“40TOPS算力的NPU”画面,所以,业界也就将≥40TOPS默认为了“新一代AI PC的NPU算力标准”(貌似微软并未官方宣布过这个标准)。而未来PC的大部分AI应用,大概率也是“云端+本地”结合的形式,而本地的AI应用,会有较大比例是微软自家提供且基于NPU算力的——而这,就是英特尔Lunar Lake大幅提升NPU算力的主要原因!如果你再看看其他厂商的处理器新品,就很容易得出相同答案。

※TIPS:国内网络环境暂时无法使用Copilot。

最后一个大家关心的问题是:在笔记本上,英特尔会放弃高性能处理器吗?

答案显然是:不会放弃。Lunar Lake是针对轻薄本的处理器,其实它有个“宏观定位”,是处理器封装功耗17W-30W的轻薄机型和超轻薄机型(继续八卦一下:别看Lunar Lake是8核8线程,但它最高功率可跑到90W!说不定功率上去了依然是一员猛将)。

而根据了解的信息,采用多核架构的高性能移动处理器酷睿H和HX也将继续保留——当然啦,新品最好是提升一下制程啦!

0 阅读:21

小A之家

简介:带来最前沿的科技资讯~