这是上一篇的续(https://tieba.baidu.com/p/8576011305?pid=148470755234&cid=0#148470755234)。有吧友说要对比一下浮点的,而且G大又上传了intrate的数据,继续与我手里E3-1245V5(略强于i7-6700)做个对比。
六代i7与上篇相同,为E3-1245V5,这个CPU就是为了与龙芯3A6000对比买的。配置为E3-1245V5/B250/2*8G/疆龙nvme 512G,所跑分数如无说明,为默认频率3.5Ghz的分数。高于普通用户常用的powersave模式,低于不锁频的performance模式。
先继续说一下整数方面,G大最新上传了3A6000 的 spec cpu2017 的8线程intrate 数据(全核心),可以比较一下,一个17分(3A6000),一个17.7分(锁3.5Ghz的E3),基本接近,有不到5%的差距,如果E3V5跑在powersave模式,只有16.7,还不如龙芯3A6000。如果分析一下17与17.7的差距,从下图可知,龙芯主要是一个子项,548.exchange2分数有有25%差距,这是一支fortran程序,递归解决数独题目,代码量不大,可能更依赖频率。其余项差距比较大的是GCC,是把C语言编译成ia32汇编的程序,这一项有20%的差距,是不是intel处理器编译intel的汇编有优势。。。。别的子项差别不是太大。这点差距,在正式发布的3A6000上估计就能追回来。总有人在说intrate-1,我确实没找到龙芯的intrate-1,如果两颗同是四核八线程的cpu的全核rate-8接近,如果多核效率类似, 那么rate-1应该也是接近的。实测六代i7的rate-1(@3.5Ghz)是4.44分,龙芯3A6000应该也差不太多。

在这里,再说一下spec官网上的分数,一般使用icc+smartheap商业库运行,性能会高很高。普通开发中,icc用的不多,搞科学计算的可能会用一点(这些人一般都是搞数理化的,不是搞计算机的),smartheap这种类库在国内也很不多见,要好几万,国内难找盗版。所以一般的开发人员与系统人员很难跑出类似的分数。
下面说浮点性能。
CPU的浮点性能在科学计算领域、部分游戏中有用。普通桌面应用、服务器应用中,基本没有浮点指令,很多游戏中也没有浮点指令,所以老胡很看重spec int性能。科学计算主要是学校、研究所用,其实是相对小众的计算应用。龙芯的浮点性能有点玄学,之前的3A5000跑linpack(解线性方程)性能很好,但spec fp的数据比较弱,远低于同频的三代酷睿i5。这一次3A6000 把通用浮点性明显的提升到了与六代i7比较接近的程度。
从Spec cpu 2006看,e3v1245V5得分56.9,龙芯3A6000得分51.7,相差10%。有三个子项得分相对低一点,分别是410.bweaves(流体动力学),465.tonto (量子化学) 481.wrf(天气预报)。其余接近。

而到了spec cpu2017,龙芯的浮点性能表现还强一点。fpseed单核龙芯是5.87,E3-1245V5为6.07,他们俩只有约3%的差距,非常接近(龙芯的成绩与GUEE的十代i3的spec fp持平)。与i7的主要差距在一个607.cactuBSSN_s的子项上,详见下图,其它项目龙芯都接近或略高。目前看来,在fpspeed这一套工作负载,龙芯在spec cpu 2017上表现更好!

跑全核8线程的浮点,GUEE跑出的成绩是18,我的E3-1245V5,跑出的成绩是19.8,对比如下图,有10%的差距,有6个子项超到E3V5, 有7个子项低于E3V5,Cactus(理论物理),nab(分子动力学)三个项目跑的不好,差距超过20%,需要优化。其它子项接近或超出。

总结:单从跑分来看,龙芯3A6000的通用浮点性能已经很不错,相比3A5000,性能几乎翻了一番,接近(但没超过)标准频率的六代i7,如果GCC作一轮优化,应该不弱于六代i7了。加上本就强悍的linpack,龙芯是可以搭建超算的。其实胡伟武自己小时候就是做高性能计算的,只是现在,因为控股的关系,曙光不用龙芯,用海光了,其实,龙芯完全可以搭建中国自己的超算集群,就不知道将来有没有用武之地。
其它感想:
中国计算机研究有三个重镇,国防科大(银河)、计算所(曙光)、江南所(神威)。当年,老胡是计算所老掌门夏院士的门生,当时掌门李院士的师弟,是百篇优博的作者,32岁当了研究员,36岁拿杰青,40出头就做所长助理,又当总工程师(相当于副厅局级干部),他像令孤冲一样,是正经的名门正派的少掌门,本可以选一条简单的人生道路,继衣钵,当局级干部,当院士,掌一派势力,指点学术江山。但老胡在最能打的时候,选择了hard模式,一心做商业CPU,确是个狠人。但今天,当LA664用2.5Ghz追平3.5Ghz的skylake,当中国计算机人用自己指令集优化linux kernel,优化gcc,几代计算机人的梦想正在逐步实现,中国人开始了制造计算机的新征程;终有一日,计算机体系结构、高性能CPU、现代编译器将从工业皇冠中除名,原创于中国的计算机系统大行于世,中国计算机人也可以“回看射雕处,千里暮云平”。
六代i7与上篇相同,为E3-1245V5,这个CPU就是为了与龙芯3A6000对比买的。配置为E3-1245V5/B250/2*8G/疆龙nvme 512G,所跑分数如无说明,为默认频率3.5Ghz的分数。高于普通用户常用的powersave模式,低于不锁频的performance模式。
先继续说一下整数方面,G大最新上传了3A6000 的 spec cpu2017 的8线程intrate 数据(全核心),可以比较一下,一个17分(3A6000),一个17.7分(锁3.5Ghz的E3),基本接近,有不到5%的差距,如果E3V5跑在powersave模式,只有16.7,还不如龙芯3A6000。如果分析一下17与17.7的差距,从下图可知,龙芯主要是一个子项,548.exchange2分数有有25%差距,这是一支fortran程序,递归解决数独题目,代码量不大,可能更依赖频率。其余项差距比较大的是GCC,是把C语言编译成ia32汇编的程序,这一项有20%的差距,是不是intel处理器编译intel的汇编有优势。。。。别的子项差别不是太大。这点差距,在正式发布的3A6000上估计就能追回来。总有人在说intrate-1,我确实没找到龙芯的intrate-1,如果两颗同是四核八线程的cpu的全核rate-8接近,如果多核效率类似, 那么rate-1应该也是接近的。实测六代i7的rate-1(@3.5Ghz)是4.44分,龙芯3A6000应该也差不太多。

在这里,再说一下spec官网上的分数,一般使用icc+smartheap商业库运行,性能会高很高。普通开发中,icc用的不多,搞科学计算的可能会用一点(这些人一般都是搞数理化的,不是搞计算机的),smartheap这种类库在国内也很不多见,要好几万,国内难找盗版。所以一般的开发人员与系统人员很难跑出类似的分数。
下面说浮点性能。
CPU的浮点性能在科学计算领域、部分游戏中有用。普通桌面应用、服务器应用中,基本没有浮点指令,很多游戏中也没有浮点指令,所以老胡很看重spec int性能。科学计算主要是学校、研究所用,其实是相对小众的计算应用。龙芯的浮点性能有点玄学,之前的3A5000跑linpack(解线性方程)性能很好,但spec fp的数据比较弱,远低于同频的三代酷睿i5。这一次3A6000 把通用浮点性明显的提升到了与六代i7比较接近的程度。
从Spec cpu 2006看,e3v1245V5得分56.9,龙芯3A6000得分51.7,相差10%。有三个子项得分相对低一点,分别是410.bweaves(流体动力学),465.tonto (量子化学) 481.wrf(天气预报)。其余接近。

而到了spec cpu2017,龙芯的浮点性能表现还强一点。fpseed单核龙芯是5.87,E3-1245V5为6.07,他们俩只有约3%的差距,非常接近(龙芯的成绩与GUEE的十代i3的spec fp持平)。与i7的主要差距在一个607.cactuBSSN_s的子项上,详见下图,其它项目龙芯都接近或略高。目前看来,在fpspeed这一套工作负载,龙芯在spec cpu 2017上表现更好!

跑全核8线程的浮点,GUEE跑出的成绩是18,我的E3-1245V5,跑出的成绩是19.8,对比如下图,有10%的差距,有6个子项超到E3V5, 有7个子项低于E3V5,Cactus(理论物理),nab(分子动力学)三个项目跑的不好,差距超过20%,需要优化。其它子项接近或超出。

总结:单从跑分来看,龙芯3A6000的通用浮点性能已经很不错,相比3A5000,性能几乎翻了一番,接近(但没超过)标准频率的六代i7,如果GCC作一轮优化,应该不弱于六代i7了。加上本就强悍的linpack,龙芯是可以搭建超算的。其实胡伟武自己小时候就是做高性能计算的,只是现在,因为控股的关系,曙光不用龙芯,用海光了,其实,龙芯完全可以搭建中国自己的超算集群,就不知道将来有没有用武之地。
其它感想:
中国计算机研究有三个重镇,国防科大(银河)、计算所(曙光)、江南所(神威)。当年,老胡是计算所老掌门夏院士的门生,当时掌门李院士的师弟,是百篇优博的作者,32岁当了研究员,36岁拿杰青,40出头就做所长助理,又当总工程师(相当于副厅局级干部),他像令孤冲一样,是正经的名门正派的少掌门,本可以选一条简单的人生道路,继衣钵,当局级干部,当院士,掌一派势力,指点学术江山。但老胡在最能打的时候,选择了hard模式,一心做商业CPU,确是个狠人。但今天,当LA664用2.5Ghz追平3.5Ghz的skylake,当中国计算机人用自己指令集优化linux kernel,优化gcc,几代计算机人的梦想正在逐步实现,中国人开始了制造计算机的新征程;终有一日,计算机体系结构、高性能CPU、现代编译器将从工业皇冠中除名,原创于中国的计算机系统大行于世,中国计算机人也可以“回看射雕处,千里暮云平”。