高通吧 关注:187,768贴子:5,119,381
  • 7回复贴,共1
Tenstorrent这几天透露了基于RV的Callandor微架构, 35分/GHZ的spec06 3.5分/GHZ的spec17的IPC,这比ARM的最强IPC微架构还强30%左右,以及发狂了的核心规模,前后端分离设计,16解码器 1K ROB 6个L/D单元,4X 256BIT SIMD 也就是SIMD1024,还有一个RV版的SME单元,算力多少我没找到具体数值。
我的评价就是一个字,发狂了。


IP属地:广东来自Android客户端1楼2025-07-18 12:51回复
    我有些疑惑的点就是 RV没必要上UOP cache,之前ARM在A77上用是为了少点功耗以及4解码器下为了输出更多uop操作,但是已经16解码器了 上这个没啥意义,除非是为了缓解取指压力。
    simd1024太夸张了 ,还有一个更夸张的矩阵加速模块 估计有2048bit,所以上了6L/D单元,存取压力太大了,这也是业界给到最豪华的配置(映象里果子和arm在超大核给的都是4L/D)
    simd1024不说了,大力出奇迹,堆规模上瘾的X925也才给了6X128也就是768simd。
    1K的rob,大概率是等效的,但也说不好是真的有这么多。还有就是大伙都说SME刷分,但是X86有AMX指令集核加速单元,ARM有SME ,RV也有专门的矩阵加速指令,RV也干了不管大伙怎么说SME这玩意刷分,反正未来就是CPU必备得玩意了,有时间我单开一贴聊聊SME GPU NPU的矩阵加速单元的情况。


    IP属地:广东来自Android客户端2楼2025-07-18 12:59
    回复
      2026-04-23 23:21:08
      广告
      不感兴趣
      开通SVIP免广告
      PPT谁做都行吧,decoupled frontend和2-taken都是业界用烂的。也就16wide decode和1k-entry ROB有点意思,不过只有8ALU,还那么重FP,感觉说不定又是一个Oyron。


      IP属地:陕西来自iPhone客户端4楼2025-07-18 13:15
      收起回复
        频率上不去吧?不然不是干翻苹果了吗?


        IP属地:江苏来自Android客户端5楼2025-07-18 13:57
        回复
          没有软件生态,这能干嘛用


          IP属地:北京来自Android客户端6楼2025-07-18 15:05
          回复
            造核弹?


            IP属地:广东来自Android客户端7楼2025-07-18 16:37
            回复
              造出来再说,16解码真跑不一定怎么样


              IP属地:山东来自Android客户端8楼2025-07-18 17:20
              回复