[轉] RDNA2對比RDNA，IPC沒有提升，核心面積白白增加

Maid sama

2021-03-19T01:09:23+00:00

Radeon RX 6700 XT vs. Radeon RX 5700 XT, Clock-for-Clock IPC Benchmark
隨手截幾張圖
[img]https://img.nga.178.com/attachments/mon_202103/20/9aQbux5-8xycXjZ5bT3cS27x-19w.png.medium.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202103/20/9aQbux5-2froXiZ53T3cS28h-193.png.medium.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202103/20/9aQbux5-dcqkXkZ5oT3cS28s-18y.png.medium.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202103/20/9aQbux5-1e7aXlZ5yT3cS235-18v.png.medium.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202103/20/9aQ8ggk-21mpXiZ51T3cS26j-195.png.medium.jpg[/img]
只能說優化過的驅動並沒有倒吸牙膏，表現糟糕，儘管大核心有損耗，還是老實堆核心來得管用，多出來的核心面積換來這點高分辨率提升簡直浪費，不如多塞幾CU

coookiie

频率提升也是要面积的啊

你以为频率提升就是超超频就结束了呢?
VEGA相比Fury IPC也是0提升, 但是频率提升了一大截. 这次看起来完全一样, 多出来的面积大部分就是为提高频率做的延迟补偿和缓存.

peak

纯一个核心堆晶体管是有极限的，牙膏和老黄的实际行动其实已经告诉我们了，另外无限缓存也是要核心面积的。以后还是看MCM吧

The Corrupted

是的amd真垃圾，等我把57xt超到2.8还不是随便打67xt

420

功耗呢？同功耗的性能可是增加了50%的。

aexotic

光追单元占用晶体管

BeansAreNifty

应该按同功耗比而不是同频

Tin man21

maxwell和pascal的ipc是一样的，甚至去掉tensor core以后turing的ipc也是一样的

Yee Crow

Reply to [pid=501629409,25984350,1]Reply[/pid] Post by [uid=37333881]Homurachyan[/uid] (2021-03-20 10:28)

而且这些卡的ipc都被费米的ipc吊着打

shXnji

然而能耗比大幅提升了

FordS_MIth

nga懂王不比知乎少

Creag

navi22 17.2b晶体管，navi10 10.3b，96m infinity cache就要吃掉5.8b晶体管，实际上也就多了1b

coookiie

Reply to [pid=501629409,25984350,1]Reply[/pid] Post by [uid=37333881]Homurachyan[/uid] (2021-03-20 10:28)

只考虑吞吐的话, Turing/Volta的FP16 IPC还是要高不少的, 而且不再依赖完全清空管线做上下文切换就可以做异步计算, 实际上效率是大幅度提高的, 这些效率提高都会被算在等效IPC的数值内.
此外Fermi的架构中核心的概念已经和Kepler/Maxwell完全不同了, 比较IPC其实是没办法比的. 因为很难确定同规模的GPU是什么.

WoIf

显卡还有ipc啊

iisszzaacckk

这结论不是很显而易见么？

lazin!

不知道算不算挖坟
最近看了下RDNA和RDNA2的核心图，感觉确实是没什么变化的

[img]https://img.nga.178.com/attachments/mon_202106/06/9aQ2o-f5bzZbT3cSlc-sg.jpg.medium.jpg[/img][img]https://img.nga.178.com/attachments/mon_202106/06/9aQ2o-lb2zZfT3cSsg-lc.jpg.medium.jpg[/img]

从表面上看，二者的变化就是无限缓存，别的没有什么区别(排除掉CU数量和分组的区别)
据说在CU内部，RDNA2是有改进的，但是就这两张图来说看不出来(毕竟没有解析到CU)

另外还有一点看不太明白，RDNA1居然有IF总线？这是干什么用的

同时还看到了一个很有意思的图片
[img]https://img.nga.178.com/attachments/mon_202106/06/9aQ2o-g8ytZaT3cSsg-lc.jpg.medium.jpg[/img]
这是在说CU只能在传统运算和RT里二选一？
CU想要运算AI相关的整数运算内容，就不能做图形相关的单精度运算？

Kerffy

以前也讨论过初代14nm和末代14nm的ipc，实际上提频率也算是工作量巨大的事情了。

[quote][pid=522086302,25984350,1]Reply[/pid] Post by [uid=13110086]团契之光[/uid] (2021-06-06 13:04):

不知道算不算挖坟
最近看了下RDNA和RDNA2的核心图，感觉确实是没什么变化的

[img]https://img.nga.178.com/attachments/mon_202106/06/9aQ2o-f5bzZbT3cSlc-sg.jpg.medium.jpg[/img][img]https://img.nga.178.com/attachments/mon_202106/06/9aQ2o-lb2zZfT3cSsg-lc.jpg.medium.jpg[/img]

从表面上看，二者的变化就是无限缓存，别的没有什么区别(排除掉CU数量和分组的区别)
据说在CU内部，RDNA2是有改进的，但是就这两张图来说看不出来(毕竟没有解[/quote]光追加速单元是在纹理单元上改的。所以在X光下感觉没啥变化

giamoni

你这没考虑rdna2拿了大量的面积去堆ifc缓存，有ifc缓存，农企才敢高端卡只给256位宽，才敢下一代搞多芯，况且还塞了光追单元，其实这代的晶体管利用率相较上代几乎翻倍了[s:ac:茶]

marigoldhoneybun9

核心面积大散热好

给帮忙解决问题的老哥转30r，楼里再roll两个10r [已解决]装系统相关，在线等急，解决问题的老哥转50r 解决完了再roll一个50r 请大家给我外甥女取个名字，采用后微信转20r 兄弟们，现在哪款游戏赚r效率点啊，在线求，差钱，急需 [摄影专贴] [器材交流] 富士XF50-140mmF2.8 R LM OIS WR，长期体验评测，样片分享 [新闻资讯] 万代成品部魂展2020 高达部分(MB，MR，R魂，GFFMC 等一大波新品) [转自微博]德国专家：等等，你说的这个我好像在哪见过…… [转帖] Facebook暂时关闭伦敦办事处新加坡来访员工感染新冠病毒 [转帖] 文稿揭示，美国可能最终有9800万人感染，48万人死亡 [转帖]原来部分ao3作者也觉得粉丝封魔了

返回主页