intel吧 关注:741,037贴子:2,903,173
  • 20回复贴,共1

听果粉说推土机时代再现?

只看楼主收藏回复



IP属地:广东1楼2024-05-24 21:16回复
    最近看果粉跳得比较欢,因为一个JKW的一个图
    听说IPC领先了63%???究竟是不是这么回事呢?


    IP属地:广东2楼2024-05-24 21:18
    回复
      既然喜欢Clang,那就用Clang,操作系统Fedora 38,自带的Clang 16.06,为了防止对Clang 版本有人钻牛角尖,顺便翻出13代首发的时候的13900K的雷丘测试。一起对比。


      IP属地:广东3楼2024-05-24 21:19
      回复
        首先是编译选项,全部写出来
        C语言:-std=c99 -O3 -march=core-avx2 -lmimalloc -fno-strict-aliasing
        C++:-std=c++11 -march=core-avx2 -lmmialloc
        解释一下编译选项,-std指定语言标准,是为了防止浮点项目blender报错,不过这里不跑浮点因为没有flang,因为装不了flang,所以所有对比删除548.exchange。-fno-strict-aliasing是SPEC默认打开的,防止502报错。禁用O2里的一个优化。
        操作系统:Fedora 38,内核6.8.9


        IP属地:广东4楼2024-05-24 21:25
        收起回复

          直接上13700KF锁频4.5GHz的测试成绩,注意,删除548项目,仅对比fortran以外的语言,删除548项目后,得分是8.38。


          IP属地:广东5楼2024-05-24 21:28
          回复

            然后上雷丘的Clang10的成绩,雷丘没有用mimalloc优化523项目,因此IPC是会有出入的。具体看对比
            以雷丘3.6G的定频测试对比我4.5G的定频测试。


            IP属地:广东6楼2024-05-24 21:36
            回复

              先是直接对比得分,4.5 vs 3.6

              再对比IPC,因为引入mimalloc优化,将导致523得到一个提升,但是提升不大,30%左右而已。比某些苹果操作系统提升小得多。
              525可能因为Clang 16和Clang 10版本差距过于巨大,带来更好的向量化所以提升明显,但是很明显还有倒***如505和531,除去mimalloc的引入,其实从Clang10到Clang16,也就3%的差异。
              所以纠结Clang版本的小丑可以消停了。


              IP属地:广东8楼2024-05-24 21:42
              回复
                我发这个贴,并不是说JKW测的有问题还是什么,SPEC这种人手一个分,不同因素影响这么大,光靠一个编译器?本来操作系统和内存配置,库函数影响就特别大。我们来清算一下,都是Clang,就算排除掉优势巨大的548拉分项目(gfortran 13这里跑了23.7拉大分,即便Flang 17跑出来也是15~16)。这颗13700KF的IPC还是比JKW的14900K高了整整12.5%,12.5%的IPC可以挤多少年牙膏?算上548,保底15%。甚至19%。达到换代的IPC差异。
                M4苹果去掉548是多少?10.95 @4.4,也就33%的差距。哪来的64%?


                IP属地:广东9楼2024-05-24 21:50
                回复
                  最后,Lion Cove要出了,正常代际IPC的提升,我已经帮intel达成了,可怜的14900K才1.65/G,我这包548可是2.07/G,IPC提升高达25%那么多,还不是ICC,还没有用ofast,还只是core-avx2通用优化


                  IP属地:广东10楼2024-05-24 21:54
                  回复
                    JamesAslan的测试里面M3对比137k,ipc领先40%,人可是利益不相关还有曾经的牙膏厂信徒破布,他同样是用GCC来测试,差距同样很大其他诸如MS的工程师David,他的测试里面M3优势更大,不过你可以说他用默认5600的内存,没给牙膏厂配好内存


                    IP属地:上海来自Android客户端11楼2024-05-24 22:06
                    收起回复
                      JKW的测试没有给出14900K的各个子项的分布,因此JKW这种测试的结果,我个人推测,就是548项目拉了分,这里指的不是正向拉分,而是被Flang反向拉分。这其实是很有可能的。
                      作为HPC相关从业者, Fortran目前都是谁在用,推动Flang和贡献Flang对谁利益最密切相关,其实去年的新闻就已经说了。
                      Fortran这门语言基本上就是ifort,gfortran和PGI。其中ifort用的最多各大超算中心标配。Flang这个玩意可能连社区都没几个活人,估计都是ARM和华为在推。


                      IP属地:广东12楼2024-05-25 01:59
                      回复
                        作为ifort的既得利益者,intel自己肯定不会去管Flang这种编译器,要知道,Flang原来甚至都不属于LLVM项目。就是个野鸡项目,后面可能获得了ARM生态里的公司推动才进入LLVM项目。推崇用Flang来编译Fortran benchmark的多少有点大病。Fortran语言最符合真实负载的就是ifort编译器。


                        IP属地:广东13楼2024-05-25 02:07
                        回复

                          LLVM项目里的Flang,看来ARM还没优化完,居然还写着尚未为生产环境就绪的,这样的编译器都可以用来跑Benchmark???浮点一半子项是Fortran,这是真的无知者无畏啊。


                          IP属地:广东14楼2024-05-25 02:21
                          回复