显卡显存位宽真的重要吗?为什么256位的2060S打不过192位的3060呢?

ash-avatar

ash

2022-08-17T04:41:38+00:00

显卡核心和显存提升所带来的性能提升比例是多少呢?
3060cuda比2060S翻倍,看到B站说的:一个显存是256一个192,而且2060s是完整的64光栅,3060只有48光栅。
而且图灵是fp32加int32,两个dispatch发射端口,安培是两个fp32加一个int32,同样两个dispatch发射端口,虽然标称CUDA流处理器多一倍,但在有Int32操作的情况下吞吐量只有50%。
有大佬解释下这什么意思吗?
peak-avatar

peak

消费者只要看最终性能就行了,显存这个东西更多是方便厂家动刀子,可以通过刻意的调整显存的位宽频率容量来影响一个东西的性能,当然只是影响,不是只看显存,大头还是看核心。
你就当多一个可以切的地方罢了,普通消费者看最终性能就行了
CORZRX-avatar

CORZRX

位宽或者说显存最终的带宽肯定重要,1660S 2060 12G这些案例都摆在那。问题是对某规格GPU来说多少带宽会开始有边际递减效应。
2060S的显存带宽有448GB/s和2080一样,很明显对2060S这个GPU这么大显存带宽是过剩的。3060是360GB/s,没有2060S高但比2060高。
pshooterbob-avatar

pshooterbob

答案是不同架构根本没法比[img]https://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc4cc6331.png[/img]
安培到图灵cuda定义都变了

一个图灵sm里有16个int32 core,16个fp32 core(被认为是16个cuda)。
一个安培sm里有16个int32/fp32 core,有16个fp32 core(被认为是32个cuda)。

变化就体现在int/fp core里,这个core是双用途的,能够根据需要跑fp32或者int32运算,这样单个安培sm在跑纯fp32负载的时候,算力就比图灵翻了一倍。
因为目前fp32普遍被用于各种应用,所以这个双用途core明显提升了效率。反过来说,如果负载根本用不上大量fp32算力,int/fp core都在跑int,那安培sm就没啥优势了。

3060有28组sm,2060s有34组sm,因为安培sm效率变强了,所以在日常负载中3060反而能略强一点点。

3060的gddr6频率高一点,显存带宽差距没有那么大,然后安培的L1比图灵翻倍了,具体显存使用策略和效率也有区别。
Skaldr Gaming-avatar

Skaldr Gaming

跨代对比无意义

Radeon HD 2900XT还512bit呢,放今天能打过谁
ash-avatar

ash

Reply to [pid=633995383,33161688,1]Reply[/pid] Post by [uid=41771372]晴空万里波澜壮阔[/uid] (2022-08-21 13:43)
膜拜大佬,解释得太专业了!那么像问下大佬,2060S和3060的游戏性能具体差多少百分比呢?
BKai-avatar

BKai

显卡不是通用架构,那两个fp32单元只有老黄调教的库在特定条件下才能用上,所以这一代性能已经不能看CUDA core的数量了
pshooterbob-avatar

pshooterbob

[quote][pid=633996449,33161688,1]Reply[/pid] Post by [uid=63676399]上线做日常[/uid] (2022-08-21 13:50):

膜拜大佬,解释得太专业了!那么像问下大佬,2060S和3060的游戏性能具体差多少百分比呢?[/quote]一般认为5%,正常人应该感觉不出来
ash-avatar

ash

Reply to [pid=634047768,33161688,1]Reply[/pid] Post by [uid=41771372]晴空万里波澜壮阔[/uid] (2022-08-21 18:29)
好的感谢兄弟!我现在用的2060S猛禽,先安心用着等3070降价再换了。。。
kuwatoron-avatar

kuwatoron

[quote][pid=634051251,33161688,1]Reply[/pid] Post by [uid=63676399]上线做日常[/uid] (2022-08-21 18:45):

好的感谢兄弟!我现在用的2060S猛禽,先安心用着等3070降价再换了。。。[/quote]换3070也没必要吧,提升太小了
Wehrmacht-avatar

Wehrmacht

[quote][pid=634051251,33161688,1]Reply[/pid] Post by [uid=63676399]上线做日常[/uid] (2022-08-21 18:45):

好的感谢兄弟!我现在用的2060S猛禽,先安心用着等3070降价再换了。。。[/quote]2060s要换得是4060起步吧
Darkmatter-avatar

Darkmatter

架构不同没有可比性
why me tho-avatar

why me tho

架构不同不能比。
用hbm2显存俩Vega你猜位宽有多少,2048bit!
søren-avatar

søren

[s:ac:闪光]amd那个2048bit位宽的,秒众生
𝔹𝕝𝕚𝕟𝕕._.𝔹𝕝𝕒𝕜𝕖-avatar

𝔹𝕝𝕚𝕟𝕕._.𝔹𝕝𝕒𝕜𝕖

[quote][pid=634051251,33161688,1]Reply[/pid] Post by [uid=63676399]上线做日常[/uid] (2022-08-21 18:45):

好的感谢兄弟!我现在用的2060S猛禽,先安心用着等3070降价再换了。。。[/quote]你这样的,至少要换3080才有体感提升。
HoIy-avatar

HoIy

6500xt64位宽弟中弟,但是核心频率2800[img]https://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc4cc6331.png[/img]
Baronduki-avatar

Baronduki

显卡位宽相当于水管直径

显存频率相当于流速

最终吞吐量=水管直径*流速

至于显卡核心,你可以把他想象成处理水的能力

我每秒钟只能淡化5吨海水,你给我个10吨的水也没用啊

都是设计好的,别怕

====

至于为什么256bit的比192bit的好,牵扯到一个上古奇案,就不多说了

简而言之,以前N卡有3根水管配4个池子的事(192bit配2GB显存),当显存接近用满的情况下会导致性能大幅下降

现在3根管子配3个池子或者6个池子就没这个问题了(192bit配6GB或者12GB),该暴显存还是得暴

(所以192bit配2GB显存这种行为是明知故犯的商业行为,也就导致我很看不起老黄)
つかさ-avatar

つかさ

安培和图灵的cuda计算方式不一样的。安培对外宣传直接翻倍了,实际上游戏性能不能按200%的cuda数算。
danielitox-avatar

danielitox

我现在2060s 正在蹲6800xt好价
应该提升挺明显的吧?带鱼屏
LongCaster-avatar

LongCaster

[quote][pid=634055558,33161688,1]Reply[/pid] Post by [uid=685351]shangso[/uid] (2022-08-21 19:06):

换3070也没必要吧,提升太小了[/quote]3070相当于2080TI了,2060S到2080TI提升还不大?