[轉] RDNA2對比RDNA,IPC沒有提升,核心面積白白增加

Maid sama-avatar

Maid sama

2021-03-19T01:09:23+00:00

Radeon RX 6700 XT vs. Radeon RX 5700 XT, Clock-for-Clock IPC Benchmark
隨手截幾張圖
[img]https://img.nga.178.com/attachments/mon_202103/20/9aQbux5-8xycXjZ5bT3cS27x-19w.png.medium.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202103/20/9aQbux5-2froXiZ53T3cS28h-193.png.medium.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202103/20/9aQbux5-dcqkXkZ5oT3cS28s-18y.png.medium.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202103/20/9aQbux5-1e7aXlZ5yT3cS235-18v.png.medium.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202103/20/9aQ8ggk-21mpXiZ51T3cS26j-195.png.medium.jpg[/img]
只能說優化過的驅動並沒有倒吸牙膏,表現糟糕,儘管大核心有損耗,還是老實堆核心來得管用,多出來的核心面積換來這點高分辨率提升簡直浪費,不如多塞幾CU
coookiie-avatar

coookiie

频率提升也是要面积的啊

你以为频率提升就是超超频就结束了呢?
VEGA相比Fury IPC也是0提升, 但是频率提升了一大截. 这次看起来完全一样, 多出来的面积大部分就是为提高频率做的延迟补偿和缓存.
peak-avatar

peak

纯一个核心堆晶体管是有极限的,牙膏和老黄的实际行动其实已经告诉我们了,另外无限缓存也是要核心面积的。以后还是看MCM吧
The Corrupted-avatar

The Corrupted

是的amd真垃圾,等我把57xt超到2.8还不是随便打67xt
420-avatar

420

功耗呢?同功耗的性能可是增加了50%的。
aexotic-avatar

aexotic

光追单元占用晶体管
BeansAreNifty-avatar

BeansAreNifty

应该按同功耗比而不是同频
Tin man21-avatar

Tin man21

maxwell和pascal的ipc是一样的,甚至去掉tensor core以后turing的ipc也是一样的
Yee Crow-avatar

Yee Crow

Reply to [pid=501629409,25984350,1]Reply[/pid] Post by [uid=37333881]Homurachyan[/uid] (2021-03-20 10:28)

而且这些卡的ipc都被费米的ipc吊着打
shXnji-avatar

shXnji

然而能耗比大幅提升了
FordS_MIth-avatar

FordS_MIth

nga懂王不比知乎少
Creag-avatar

Creag

navi22 17.2b晶体管,navi10 10.3b,96m infinity cache就要吃掉5.8b晶体管,实际上也就多了1b
coookiie-avatar

coookiie

Reply to [pid=501629409,25984350,1]Reply[/pid] Post by [uid=37333881]Homurachyan[/uid] (2021-03-20 10:28)

只考虑吞吐的话, Turing/Volta的FP16 IPC还是要高不少的, 而且不再依赖完全清空管线做上下文切换就可以做异步计算, 实际上效率是大幅度提高的, 这些效率提高都会被算在等效IPC的数值内.
此外Fermi的架构中核心的概念已经和Kepler/Maxwell完全不同了, 比较IPC其实是没办法比的. 因为很难确定同规模的GPU是什么.
WoIf-avatar

WoIf

显卡还有ipc啊
iisszzaacckk-avatar

iisszzaacckk

这结论不是很显而易见么?
lazin!-avatar

lazin!

不知道算不算挖坟
最近看了下RDNA和RDNA2的核心图,感觉确实是没什么变化的

[img]https://img.nga.178.com/attachments/mon_202106/06/9aQ2o-f5bzZbT3cSlc-sg.jpg.medium.jpg[/img][img]https://img.nga.178.com/attachments/mon_202106/06/9aQ2o-lb2zZfT3cSsg-lc.jpg.medium.jpg[/img]

从表面上看,二者的变化就是无限缓存,别的没有什么区别(排除掉CU数量和分组的区别)
据说在CU内部,RDNA2是有改进的,但是就这两张图来说看不出来(毕竟没有解析到CU)


另外还有一点看不太明白,RDNA1居然有IF总线?这是干什么用的




同时还看到了一个很有意思的图片
[img]https://img.nga.178.com/attachments/mon_202106/06/9aQ2o-g8ytZaT3cSsg-lc.jpg.medium.jpg[/img]
这是在说CU只能在传统运算和RT里二选一?
CU想要运算AI相关的整数运算内容,就不能做图形相关的单精度运算?
Kerffy-avatar

Kerffy

以前也讨论过初代14nm和末代14nm的ipc,实际上提频率也算是工作量巨大的事情了。
AE-avatar

AE

[quote][pid=522086302,25984350,1]Reply[/pid] Post by [uid=13110086]团契之光[/uid] (2021-06-06 13:04):

不知道算不算挖坟
最近看了下RDNA和RDNA2的核心图,感觉确实是没什么变化的

[img]https://img.nga.178.com/attachments/mon_202106/06/9aQ2o-f5bzZbT3cSlc-sg.jpg.medium.jpg[/img][img]https://img.nga.178.com/attachments/mon_202106/06/9aQ2o-lb2zZfT3cSsg-lc.jpg.medium.jpg[/img]

从表面上看,二者的变化就是无限缓存,别的没有什么区别(排除掉CU数量和分组的区别)
据说在CU内部,RDNA2是有改进的,但是就这两张图来说看不出来(毕竟没有解[/quote]光追加速单元是在纹理单元上改的。所以在X光下感觉没啥变化
giamoni-avatar

giamoni

你这没考虑rdna2拿了大量的面积去堆ifc缓存,有ifc缓存,农企才敢高端卡只给256位宽,才敢下一代搞多芯,况且还塞了光追单元,其实这代的晶体管利用率相较上代几乎翻倍了[s:ac:茶]
marigoldhoneybun9-avatar

marigoldhoneybun9

核心面积大散热好