我看了一下,主要改进在前端,解码器换成了和gracemont一样的3DX2组共6解码器,BPU预测带宽提高了4倍,后端ALU支持了TF32的AI格式,vnni指令集相关的性能翻倍,可能MAC宽度翻倍了。剩下的就是L1I $从32还是48提高到64KB了,带宽有提升,但是延迟应该高很多,现在能够每周期发射8个uop执行了,ADL和RPL好像都是7个。
整体算下来5—7%的IPC提升,当然也可能5—10%,依然还是skylack+++++++++ ,只听说过jim参与的巨核是3D X4=12D,ROB1024的royal cove,期待一波。

整体算下来5—7%的IPC提升,当然也可能5—10%,依然还是skylack+++++++++ ,只听说过jim参与的巨核是3D X4=12D,ROB1024的royal cove,期待一波。














