智慧印刷工坊

智慧印刷工坊

能从实测性能依旧勉强的Ice Lake SP挖掘到什么亮点?

admin 147 186

上一篇中主要从纸面上说了说IcelakeSP,这里补充一下关于IcelakeSP的一些性能以及表现的评价。先说一个结论,对于IcelakeSP来说,它最大的问题是它的制造工艺10+非常不给力,它的惊喜之处也在于用了10+,也还是做到了比14++只好不差。

IcelakeSP用的是和IcelakeU类似的10+工艺,官方宣传过有所改进,但应该是从良品率附近改进的,IcelakeSP的整体频率和能耗,还是接近于IcelakeU和CometLakeU的那种10nmvs14nm状态。从目前官方公布的IcelakeSP规格来看,IcelakeSP的频率都非常低,对比同为3代Xeon的CooperLake也都要低,旗舰型号只做到了3.4G的单核睿频,这个趋势简直和Icelake一毛一样。


Icelake-SP仍然是单芯片设计,所以理论上IcelakeSP的延迟表现应该也是不错的。


从核心延迟上来看,Icelake的XCC40C表现还是比较理想的,比起CascadeLake略微高了那么一些,但是高的不多。这里的单位是延迟,IcelakeSP的频率明显不如CasecadeLake,并且是在更大的Mesh网络上,这个表现真的可以接受了。


作为对比看看AMDMilanEPYC7763的表现咯,Milan是个复杂的胶水系统。在一个CCD内,Zen3的延迟是20多ns,只有IcelakeSP的一半,表现非常好。但是一旦跨越CCD那么,延迟骤增。其中如果跨越到IOD的同一边,那么延迟升高到95ns,如果是IOD的另一边则是再升高到110ns附近,这就是胶水的一个典型弊端了。


剩下还有一些以ns为单位的延迟,大家可以自己看一下,IcelakeSP的低频吃亏很多。不过如果是看不被频率影响的周期(应该看到L3就可以了,内存还是会被影响到),IcelakeSP和纸面上的参数类似,L1升高一个周期,L2不变,L3降低。


最终实际内存性能提升的也很夸张(Altra那个似乎有一些额外的融合机制,在这个测试中算法不一样了)。


然后就回到能耗比上。在10+拉胯的背景下,IcelakeSP在同样同样核心下,能耗比和CascadeLakeSP基本一致。但是这要注意的是,这个IceLakeSP并不是CasecadeLake用的28C的那个8280的直接对应版,6330的体质明显要差。所以那些直接拿这个定型IcelakeSP和CascadeLake能耗比的是想干什么就不用说了。就像我拿5600X和3800XT去定型Zen3相对于Zen2的提升。


而且A站之前也给EPYC3Milan上了类似的评测,EPYC3的能耗比倒退就是了。


接下来回到我们常见的SPEC2017性能,我们先看单线程的性能:


上面的图可能不太直观,这里转变成大家容易看懂的形式,IcelakeSP的SunnyCove核心实际上相对Skylake提升30%,略高于Zen3一点点,最终基本可以看成在SPEC上,SunnyCove和Zen3是同样水平的核心。


但是如果是到了多核场景,那么IcelakeSP立马就败下阵来,IcelakeSP所用的10+属于难以抢救的形式。IcelakeSP的IPC和Zen3一个水平,但是40C的8380打不过Zen332C的7763,这就意味着IcelakeSP所用的10nm实际能耗比非常堪忧,频率上不去。想想IcelakeU,再想想这个,就不觉得奇怪了。



Anandtech还测试了一些其他性能,不过我觉得那些项目总体来说和SPEC的情况差不多,都是比较偏向传统应用服务器的性能的。而至于像HPC、AI或者加解密这些服务器的重度使用场景,Anandtech就没测试了。

小结:为什么从IcelakeSP看到了希望?

如果单纯从SPEC性能来看,IcelakeSP还属于非常拉胯的表现,但是为什么会说从IcelakeSP里看到了希望呢?

从Anandtech的性能测试来看,Anandtech本身是一个面向消费群体的网站,其测试本身只是Xeon应用的一个方向而已,也是相对于AMD来说,Intel表现最弱势的一面了。比如说Xeon的一大重头戏是HPC、AI,Anandtech本身也没有涉及到。SPEC2017所衡量的范围并不包含这些。在实际的应用中,并没有那么拉胯。

更重要的是,IcelakeSP这东西是Intel按部就班推出的一个产品,IcelakeSP用着Intel目前的次等技术,10nm不是最新的10nmSuperFin,架构也只是Skylake后的第一个Tick-Tock。Icelake-SP和更早推出的TigerLake不一样,它仍然是Intel10nm阴霾下的一个产品。

所以从IcelakeSP的表现来看,下一代XeonSapphireRapids的性能预期就变得极为可观了起来。首先,从Icelake到TigerLake来看,10+到10SF在这个频率范围内做到了频率提升30%(1068,1185),而下一代10ESF会更强。现在就假设直接把Icelake改成10ESF,那么性能就直接提升30%了。与此同时SapphireRapids会用GoldenCove核心,IPC再进步20-30%,核心堆到56C(可能会有胶水72C吧),SapphireRapids的性能预期会非常可观。

当然SapphireRapids的竞争对手是Zen4,那个传说中有96C12通道的怪物。关于他们的预览,我觉得我还需要一点时间消化,就随后一点再聊吧。