一篇看清Arc独显AI出图能力怎样?三张Intel独显横评告诉你!

奕口大锅看科技 2024-10-07 14:10:46

之前使用Arc A580 Index 8G与Arc A770 Photon 8G OC跑了下Stable Fusion,出图压力满载情况下,速度差距差不多在18%左右。测试过程中两张卡都是8G,所以都是16张512*512跑满显存。那要是使用16G的A770跑图会是什么效果,能比8G版本更强么?怀着这个想法,笔者想办法借到了一张Arc A770 Photon 16G OC W亚运特别版。

首先让我们感谢喂饭佛祖@秋葉aaaki、AI金刚@Nuullll。在他们的努力下,Intel显卡卡用户能够获得和N卡用户几乎一样的应用体验,甚至于最新的Ultra处理器都可以跑一跑AI绘图了。

部署相应的环境有三种方法:第一个是WSL直接安装,第二个是通过Docker安装,第三个是直接抄作业使用整合包。前两个方法的操作过于复杂:WSL需要开启HyperV后安装Linux子系统,安装好对应驱动与Python后,就可以通过Intel Extension for Pytorch(IPEX)调用Intel Arc显卡跑图,这里的设置是步步踩坑;Docker也是安装到WSL系统中,但Docker一样各种出问题。最省事的就是选择整合包,让我们再次感谢喂饭佛祖@秋葉aaaki、AI金刚@Nuullll。

1.显卡对比

在显卡价格还都在高位的时候入手了蓝戟的Arc A770 Photon 8G OC,前一阵又搞了一张蓝戟的Arc A580 Index把玩测试了一轮。把这两张卡都跑了几轮Stable Diffusion,看了下大致的性能差距。考虑到N卡同配置的显存占用,发现Intel Arc显卡还是有优化空间的。而且两张卡都是8G显存,如果拿出来一张16G的Intel Arc显卡,性能表现会有进一步提什么?抱着这个想法,借到了一张Arc A770 Photon 16G OC W 亚运特别版,拉出来看看表现如何。

A580的规格是253mm双风扇,两张A770的规格是300mm三风扇,而且都是适合紧凑型装机的双槽卡。不过A580比两张A770 肉眼可见的“糙”一些,毕竟首发价格差了一倍。

三张卡都是2*8Pin供电,A770的基础功率是194W,软拉功率225W,A580的基础功率是134W,软拉功率185W。Arc系列显卡预留将近30-50W左右的官方软超空间,直接在软件里一键拉满功耗,顶多再调个电压偏离就完了。不过这三张卡都是在默认功耗下进行的测试,没有拉功率进行进一步测试。其实还是因为测试项太多了,要是拉功率就是三倍工作量了(默认、单拉功耗、拉功耗拉电压)。

Intel A系列桌面端显卡参数对比图如下,来源于Intel官网产品对比。A580相比A770少了8个Xe核心,其下其他单元组件的数量也都符合这个比例,而A770 16G版本则是有更高的显存带宽与频率。

外观就不多说了,直接来到测试部分看表。相应测试截图就不单独放出了,A770的分数领先A580在30%左右,略低于两者构架等级的差异水平。单以3D Mark11的测试分数来看,A580应该对位RTX 4060,当然价格差距在这摆着,实际表现肯定是差着的。类似于A770对位RTX3070、RTX 4060Ti的情况,价格差距摆着性能差距自然是存在的。

XeSS是Intel家类似于Nvidia DLSS的功能,能够有效的提升画面的帧数表现。测试选项定为分辨率1920*1080的性能档,基本都能取得超过40%的帧数提升。认证观察性能档下部分场景的话,肉眼是能够看出区别的,沉浸在游戏中基本都可以忽略。

三者的PCIe带宽基本没有太大的区别,上下只差了200MB/s,A770 OC 16G,都超过了PCIe 4.0 x8对应的256GT/s通信速率(即约为15.75GB/s有效带宽)。这样看两张卡都需要在PCIe 4.0 x16规格下才能发挥满血性能,但实际上即便PCIe插槽的规格不够顶多也就损失个1-2%,基本可以忽略不计,老平台也可以升级这张卡。

通过《古墓丽影:暗影》的基准测试给显卡拉了六个整组的测试,分别是Arc A770 8G/16G、Arc A580,API为DX12时,分别在1440P与1080P分辨率下进行测试。每组测试分为三个小项并记录数据:关闭XeSS,开启XeSS高品质档,开启XeSS性能档。A770 16G与A770 8G的表现完全一致,仅有个别条目相差1帧。可以看到除了个别情况,2K分辨率下A770基本是A580性能表现的120%-125%,1080P分辨率下A770基本是A580性能表现的的115%-120%。

2.AI出图对比

基于绘世启动器2.8.1版本的默认设置,进行第一轮的AI出图测试,单批单张、分辨率512*512、迭代步数20步。由于显示总体平均速度的时间过短难以截图,所以选择较为靠后时进行截图,保证数据相对稳定。Arc A770 16G的迭代速度达到了6.30步/秒,从先前的测试就能看出来,这轮测试连8G都吃不满。

再来回顾下Arc A770 8G的迭代速度,6.23步/秒是略低于Arc A770 16G的,但这里的性能差值来自显存还是位宽暂时无法确定。

再来回顾使用完全相同的步骤与提示词,操作Arc A580出图,迭代速度速度可以达到6.13步/秒,同样没有吃满8GB显存。速度表现低于Arc A770 8G与Arc A770 16G,不管从位宽、GPU频率、处理单元数量等规格,还是以满载功耗考虑都没拉开距离。

所以接下来的测试必须要拉满负载,看看二者性能能拉开多少。测试了单批10张依旧没能吃满显存,所以直接定在单批16张迭代20次,8G这两张卡显存占用就直接拉满了。回到测试中,Arc A770 8G能够跑到1.41秒/步的速度,细心的读者可以发现数据单位直接翻转了,进行数据对比时注意要取倒数。

再看Arc A580在相同的设置下,迭代速度为1.73秒每步,数据加权平均后Arc A770的迭代速度大约领先Arc A580有18%左右,基本符合二者的其他维度表现出的性能差距。

但Arc A770 16G可没有吃满,大显存的优势这就出来了。本轮测试能够跑到1.27秒/步的速度,相较Arc A770 8G又提高了10%。比较二者的显存速率能够确认,差异就是来自这里。而且显存带宽的差异也是来自显存速率,所以仍旧无法对AI出图的性能定量对比。

拉到20张,Arc A770 16G的迭代速度就到了1.73秒每步,而且运行过程中仍旧没有吃满显存。但即便是再加单批图片数量,也一样是不能吃满显存。应该得更换模型和设置才有可能吃满,但按照现在的迭代速度有显得不是太有必要。笔者这轮还专门测试了不同显存优化设置下的情况,结论就是对于大显存的显卡而言,开不开完全没有任何区别,出图速率是完全一样的。

AI绘图数据汇总后就能看到,对于单图速度而言,三张显卡的出图速度没有太大区别。而到16图后的出图等效速度就拉开了,根据等效差距计算可以明确核心的影响>显存的影响。先前测试时还不能完整发挥A770亚运版16G大显存的优势,随着后续驱动和适配的更新应该还会有提升。

3.总结

完全从游戏性价比出发,这几张卡里最适合购买的还是A580。但对于需要高显存的生产力应用,就只能继续考虑A770了。这张亚运特别版借给哥们后,使用视频压制软件HandBrake验证“Deep Link超级编码器”功能,进行HEVC视频压制时,观测到核显的解码器部分有大幅负载,独显也同样如此,说明Deep Link功能正在被调用。实际压制速度会有20%以上的提升,显示Arc独显在编解码上还是很能打的。

如果觉得此篇文章对您有帮助的话,还请多多点赞、收藏评论。这里是老锅,我们下期再见!

1 阅读:40

奕口大锅看科技

简介:感谢大家的关注