网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
09月20日漏签0天
龙芯吧 关注:26,233贴子:701,718
  • 看贴

  • 图片

  • 吧主推荐

  • 视频

  • 游戏

  • 0回复贴,共1页
<<返回龙芯吧
>0< 加载中...

龙芯3A6000与六代i7的性能对比(续)

  • 取消只看楼主
  • 收藏

  • 回复
  • zosunix
  • 龙芯3A
    9
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
这是上一篇的续(https://tieba.baidu.com/p/8576011305?pid=148470755234&cid=0#148470755234)。有吧友说要对比一下浮点的,而且G大又上传了intrate的数据,继续与我手里E3-1245V5(略强于i7-6700)做个对比。
六代i7与上篇相同,为E3-1245V5,这个CPU就是为了与龙芯3A6000对比买的。配置为E3-1245V5/B250/2*8G/疆龙nvme 512G,所跑分数如无说明,为默认频率3.5Ghz的分数。高于普通用户常用的powersave模式,低于不锁频的performance模式。
先继续说一下整数方面,G大最新上传了3A6000 的 spec cpu2017 的8线程intrate 数据(全核心),可以比较一下,一个17分(3A6000),一个17.7分(锁3.5Ghz的E3),基本接近,有不到5%的差距,如果E3V5跑在powersave模式,只有16.7,还不如龙芯3A6000。如果分析一下17与17.7的差距,从下图可知,龙芯主要是一个子项,548.exchange2分数有有25%差距,这是一支fortran程序,递归解决数独题目,代码量不大,可能更依赖频率。其余项差距比较大的是GCC,是把C语言编译成ia32汇编的程序,这一项有20%的差距,是不是intel处理器编译intel的汇编有优势。。。。别的子项差别不是太大。这点差距,在正式发布的3A6000上估计就能追回来。总有人在说intrate-1,我确实没找到龙芯的intrate-1,如果两颗同是四核八线程的cpu的全核rate-8接近,如果多核效率类似, 那么rate-1应该也是接近的。实测六代i7的rate-1(@3.5Ghz)是4.44分,龙芯3A6000应该也差不太多。

在这里,再说一下spec官网上的分数,一般使用icc+smartheap商业库运行,性能会高很高。普通开发中,icc用的不多,搞科学计算的可能会用一点(这些人一般都是搞数理化的,不是搞计算机的),smartheap这种类库在国内也很不多见,要好几万,国内难找盗版。所以一般的开发人员与系统人员很难跑出类似的分数。
下面说浮点性能。
CPU的浮点性能在科学计算领域、部分游戏中有用。普通桌面应用、服务器应用中,基本没有浮点指令,很多游戏中也没有浮点指令,所以老胡很看重spec int性能。科学计算主要是学校、研究所用,其实是相对小众的计算应用。龙芯的浮点性能有点玄学,之前的3A5000跑linpack(解线性方程)性能很好,但spec fp的数据比较弱,远低于同频的三代酷睿i5。这一次3A6000 把通用浮点性明显的提升到了与六代i7比较接近的程度。
从Spec cpu 2006看,e3v1245V5得分56.9,龙芯3A6000得分51.7,相差10%。有三个子项得分相对低一点,分别是410.bweaves(流体动力学),465.tonto (量子化学) 481.wrf(天气预报)。其余接近。

而到了spec cpu2017,龙芯的浮点性能表现还强一点。fpseed单核龙芯是5.87,E3-1245V5为6.07,他们俩只有约3%的差距,非常接近(龙芯的成绩与GUEE的十代i3的spec fp持平)。与i7的主要差距在一个607.cactuBSSN_s的子项上,详见下图,其它项目龙芯都接近或略高。目前看来,在fpspeed这一套工作负载,龙芯在spec cpu 2017上表现更好!

跑全核8线程的浮点,GUEE跑出的成绩是18,我的E3-1245V5,跑出的成绩是19.8,对比如下图,有10%的差距,有6个子项超到E3V5, 有7个子项低于E3V5,Cactus(理论物理),nab(分子动力学)三个项目跑的不好,差距超过20%,需要优化。其它子项接近或超出。

总结:单从跑分来看,龙芯3A6000的通用浮点性能已经很不错,相比3A5000,性能几乎翻了一番,接近(但没超过)标准频率的六代i7,如果GCC作一轮优化,应该不弱于六代i7了。加上本就强悍的linpack,龙芯是可以搭建超算的。其实胡伟武自己小时候就是做高性能计算的,只是现在,因为控股的关系,曙光不用龙芯,用海光了,其实,龙芯完全可以搭建中国自己的超算集群,就不知道将来有没有用武之地。
其它感想:
中国计算机研究有三个重镇,国防科大(银河)、计算所(曙光)、江南所(神威)。当年,老胡是计算所老掌门夏院士的门生,当时掌门李院士的师弟,是百篇优博的作者,32岁当了研究员,36岁拿杰青,40出头就做所长助理,又当总工程师(相当于副厅局级干部),他像令孤冲一样,是正经的名门正派的少掌门,本可以选一条简单的人生道路,继衣钵,当局级干部,当院士,掌一派势力,指点学术江山。但老胡在最能打的时候,选择了hard模式,一心做商业CPU,确是个狠人。但今天,当LA664用2.5Ghz追平3.5Ghz的skylake,当中国计算机人用自己指令集优化linux kernel,优化gcc,几代计算机人的梦想正在逐步实现,中国人开始了制造计算机的新征程;终有一日,计算机体系结构、高性能CPU、现代编译器将从工业皇冠中除名,原创于中国的计算机系统大行于世,中国计算机人也可以“回看射雕处,千里暮云平”。


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 0回复贴,共1页
<<返回龙芯吧
分享到:
©2025 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示