龙芯预测CPU性能,结果也会不准

guee评科技 2024-04-11 02:46:36

  龙芯的胡伟武老师,一直在中科院大学有授课任务,最近是期末复习以及讲解CPU流片(生产样品)前的性能预测。在课堂上以龙芯自己的实际经验和实测数据为教材,讲述了CPU性能预测和校准的方法,从最开始时预测性能与实际性能相差一倍的“黑历史”,讲到经过各种校准之后现在仍然会有各种因素造成预测误差,得出结论:“硅是检验结构设计的唯一标准!”,因为“模拟器不准,FPGA也不准,在流片前你就搞不准!”

  胡老师说:“我们最近有个芯片回来,叫2K2000,(我们)回来特别高兴,因为我们流片前低估了20~30%的性能,回来之后性能比预测的好很多那就高兴,但要是回来之后比预测的差很多呢,那不就麻烦了吗?”

  CPU流片实测比预测的差,这在业界很常见。比如飞腾在2015年预测“火星”微架构达到9.6分/GHz(单核整数),直到现在飞腾性能最高的产品还只有6.7分/GHz(单核整数)的水平。飞腾最新的PPT上未来的产品“预测”的每GHz的性能已经超过了当前的Intel,可能也无法实现。龙芯2005年前也有类似的“黑历史”,因此后来在预测CPU性能时着重加强了校准,参数配置也越来越保守,以至于2K2000的实测性能反而比预测的还高20~30%。

  2K2000是基于龙芯LA364处理器核,3发射64位,具有高性能、接口丰富、功耗伸缩性强等特点。主要应用场景为工控互联网、打印终端、BMC、交换机、边缘网关、工业防火墙、工业平板、智能变电站、挂号自助机等。据尚未公布的实测数据,SPEC CPU 2006的int_base成绩达到8.99/GHz(单核整数),1.5GHz时得分13.48,远远超过上一代产品2K1000LA。此成绩非龙芯官方公布,而是能接触到2K2000样片的某人偷跑泄露。

  下表中的成绩都是实测数据,但都没有细致配置测试环境和参数,而是统一使用GCC编译器“-Ofast”参数测试SPEC CPU 2006单核性能,结果可能和厂商公布的成绩有差异,成绩越高说明CPU性能越高。龙芯2K2000的成绩也只能印证胡老师所说的“低估了20~30%”,不能代表将来正式发布的成绩。各款CPU的主频也仅是指测试时的主频,不代表实际产品的主频。

  U740的单核成绩很低,就算不考虑多核并行的损耗,直接把4个核加起来也比不上2K2000的一个核心。如果考虑多核并行的损耗,那么4核的U740也比不上2核的2K1000LA或者2K1500。

  飞腾E2000Q的测试成绩也不好,每GHz的成绩并不比U740好多少,我怀疑是大小核的调配有问题,导致实际跑的是小核。因为使用FTC663核心的D2000桌面CPU每GHz整数得分有6.7,作为升级版的FTC664核心不应该才这种水平。不过FTC664核心目前只有E2000Q在使用,因此性能还缺少其它的佐证,如果FTC664是为了用于低功耗工控而简化了设计,那么现在的测试成绩也是合理的。

  2K1000LA是使用的LA264处理器核,2发射64位,使用相同参数实测每GHz的成绩是4.22。3发射的LA364核心每GHz的成绩居然接近了桌面处理器3A5000, 难怪令胡老师也始料未及。3A5000使用的LA464处理器核,得分约10.6每GHz,与酷睿11代的13分每GHz还有明显差距。下一代LA664核心预计设计水平与酷睿11代及Zen3相当,也是13分每GHz,只要能够达到,就说明龙芯的CPU核心设计水平已经非常接近Intel和AMD,但CPU后端设计能力以及国内的工艺水平仍然需要加强,才能缩小与Intel和AMD的频率差距。

  衷心希望下一代桌面产品3A6000也出现预测比实际低20~30%的乌龙,尽管不太可能!

0 阅读:0

guee评科技

简介:感谢大家的关注