一篇看清Arc独显AI出图能力怎样？三张Intel独显横评告诉你！

之前使用Arc A580 Index 8G与Arc A770 Photon 8G OC跑了下Stable Fusion，出图压力满载情况下，速度差距差不多在18%左右。测试过程中两张卡都是8G，所以都是16张512*512跑满显存。那要是使用16G的A770跑图会是什么效果，能比8G版本更强么？怀着这个想法，笔者想办法借到了一张Arc A770 Photon 16G OC W亚运特别版。

首先让我们感谢喂饭佛祖@秋葉aaaki、AI金刚@Nuullll。在他们的努力下，Intel显卡卡用户能够获得和N卡用户几乎一样的应用体验，甚至于最新的Ultra处理器都可以跑一跑AI绘图了。

部署相应的环境有三种方法：第一个是WSL直接安装，第二个是通过Docker安装，第三个是直接抄作业使用整合包。前两个方法的操作过于复杂：WSL需要开启HyperV后安装Linux子系统,安装好对应驱动与Python后,就可以通过Intel Extension for Pytorch(IPEX)调用Intel Arc显卡跑图，这里的设置是步步踩坑；Docker也是安装到WSL系统中，但Docker一样各种出问题。最省事的就是选择整合包，让我们再次感谢喂饭佛祖@秋葉aaaki、AI金刚@Nuullll。

1.显卡对比

在显卡价格还都在高位的时候入手了蓝戟的Arc A770 Photon 8G OC，前一阵又搞了一张蓝戟的Arc A580 Index把玩测试了一轮。把这两张卡都跑了几轮Stable Diffusion，看了下大致的性能差距。考虑到N卡同配置的显存占用，发现Intel Arc显卡还是有优化空间的。而且两张卡都是8G显存，如果拿出来一张16G的Intel Arc显卡，性能表现会有进一步提什么？抱着这个想法，借到了一张Arc A770 Photon 16G OC W 亚运特别版，拉出来看看表现如何。

A580的规格是253mm双风扇，两张A770的规格是300mm三风扇，而且都是适合紧凑型装机的双槽卡。不过A580比两张A770 肉眼可见的“糙”一些，毕竟首发价格差了一倍。

三张卡都是2*8Pin供电，A770的基础功率是194W，软拉功率225W，A580的基础功率是134W，软拉功率185W。Arc系列显卡预留将近30-50W左右的官方软超空间，直接在软件里一键拉满功耗，顶多再调个电压偏离就完了。不过这三张卡都是在默认功耗下进行的测试，没有拉功率进行进一步测试。其实还是因为测试项太多了，要是拉功率就是三倍工作量了（默认、单拉功耗、拉功耗拉电压）。

Intel A系列桌面端显卡参数对比图如下，来源于Intel官网产品对比。A580相比A770少了8个Xe核心，其下其他单元组件的数量也都符合这个比例，而A770 16G版本则是有更高的显存带宽与频率。

外观就不多说了，直接来到测试部分看表。相应测试截图就不单独放出了，A770的分数领先A580在30%左右，略低于两者构架等级的差异水平。单以3D Mark11的测试分数来看，A580应该对位RTX 4060，当然价格差距在这摆着，实际表现肯定是差着的。类似于A770对位RTX3070、RTX 4060Ti的情况，价格差距摆着性能差距自然是存在的。

XeSS是Intel家类似于Nvidia DLSS的功能，能够有效的提升画面的帧数表现。测试选项定为分辨率1920*1080的性能档，基本都能取得超过40%的帧数提升。认证观察性能档下部分场景的话，肉眼是能够看出区别的，沉浸在游戏中基本都可以忽略。

三者的PCIe带宽基本没有太大的区别，上下只差了200MB/s，A770 OC 16G，都超过了PCIe 4.0 x8对应的256GT/s通信速率（即约为15.75GB/s有效带宽）。这样看两张卡都需要在PCIe 4.0 x16规格下才能发挥满血性能，但实际上即便PCIe插槽的规格不够顶多也就损失个1-2%，基本可以忽略不计，老平台也可以升级这张卡。

通过《古墓丽影：暗影》的基准测试给显卡拉了六个整组的测试，分别是Arc A770 8G/16G、Arc A580，API为DX12时，分别在1440P与1080P分辨率下进行测试。每组测试分为三个小项并记录数据：关闭XeSS，开启XeSS高品质档，开启XeSS性能档。A770 16G与A770 8G的表现完全一致，仅有个别条目相差1帧。可以看到除了个别情况，2K分辨率下A770基本是A580性能表现的120%-125%，1080P分辨率下A770基本是A580性能表现的的115%-120%。

2.AI出图对比

基于绘世启动器2.8.1版本的默认设置，进行第一轮的AI出图测试，单批单张、分辨率512*512、迭代步数20步。由于显示总体平均速度的时间过短难以截图，所以选择较为靠后时进行截图，保证数据相对稳定。Arc A770 16G的迭代速度达到了6.30步/秒，从先前的测试就能看出来，这轮测试连8G都吃不满。

再来回顾下Arc A770 8G的迭代速度，6.23步/秒是略低于Arc A770 16G的，但这里的性能差值来自显存还是位宽暂时无法确定。

再来回顾使用完全相同的步骤与提示词，操作Arc A580出图，迭代速度速度可以达到6.13步/秒，同样没有吃满8GB显存。速度表现低于Arc A770 8G与Arc A770 16G，不管从位宽、GPU频率、处理单元数量等规格，还是以满载功耗考虑都没拉开距离。

所以接下来的测试必须要拉满负载，看看二者性能能拉开多少。测试了单批10张依旧没能吃满显存，所以直接定在单批16张迭代20次，8G这两张卡显存占用就直接拉满了。回到测试中，Arc A770 8G能够跑到1.41秒/步的速度，细心的读者可以发现数据单位直接翻转了，进行数据对比时注意要取倒数。

再看Arc A580在相同的设置下，迭代速度为1.73秒每步，数据加权平均后Arc A770的迭代速度大约领先Arc A580有18%左右，基本符合二者的其他维度表现出的性能差距。

但Arc A770 16G可没有吃满，大显存的优势这就出来了。本轮测试能够跑到1.27秒/步的速度，相较Arc A770 8G又提高了10%。比较二者的显存速率能够确认，差异就是来自这里。而且显存带宽的差异也是来自显存速率，所以仍旧无法对AI出图的性能定量对比。

拉到20张，Arc A770 16G的迭代速度就到了1.73秒每步，而且运行过程中仍旧没有吃满显存。但即便是再加单批图片数量，也一样是不能吃满显存。应该得更换模型和设置才有可能吃满，但按照现在的迭代速度有显得不是太有必要。笔者这轮还专门测试了不同显存优化设置下的情况，结论就是对于大显存的显卡而言，开不开完全没有任何区别，出图速率是完全一样的。

AI绘图数据汇总后就能看到，对于单图速度而言，三张显卡的出图速度没有太大区别。而到16图后的出图等效速度就拉开了，根据等效差距计算可以明确核心的影响＞显存的影响。先前测试时还不能完整发挥A770亚运版16G大显存的优势，随着后续驱动和适配的更新应该还会有提升。

3.总结

完全从游戏性价比出发，这几张卡里最适合购买的还是A580。但对于需要高显存的生产力应用，就只能继续考虑A770了。这张亚运特别版借给哥们后，使用视频压制软件HandBrake验证“Deep Link超级编码器”功能，进行HEVC视频压制时，观测到核显的解码器部分有大幅负载，独显也同样如此，说明Deep Link功能正在被调用。实际压制速度会有20%以上的提升，显示Arc独显在编解码上还是很能打的。

如果觉得此篇文章对您有帮助的话，还请多多点赞、收藏评论。这里是老锅，我们下期再见！

DC生肖网

一篇看清Arc独显AI出图能力怎样？三张Intel独显横评告诉你！

奕口大锅看科技