显卡的cuda核心有IPC的概念吗?比如1080和2070 super

FrostScale-avatar

FrostScale

2020-12-06T08:33:25+00:00

GTX 1080和RTX 2070 Super都是2560个cuda核心。[s:ac:怕]
那么显卡的核心有没有IPC的概念呢?
我的意思是,会不会它们虽然核心数相同,但是核心的每时钟周期的指令处理能力不同,导致它们的性能在同核心数量和同频率下仍然有很大差距。[s:ac:怕]
Shi1ler-avatar

Shi1ler

虽然不是很懂,但是显卡的计算单元都是简单地并行计算,不涉及复杂指令,所以没有ipc这一说吧
lazin!-avatar

lazin!

当然有
cuda只是单元,但是10系和20系架构是不一样的,因此同cuda同频率性能20系更强
FrostScale-avatar

FrostScale

[quote][pid=475158710,24557614,1]Reply[/pid] Post by [uid=13110086]团契之光[/uid] (2020-12-09 16:49):

当然有
cuda只是单元,但是10系和20系架构是不一样的,因此同cuda同频率性能20系更强[/quote]所以不能单纯看cuda核心数量来判断两代显卡的性能差距嘛?[s:ac:茶]
WoIf-avatar

WoIf

ppc肯定有

ipc不清楚
FATED-avatar

FATED

[quote][pid=475159106,24557614,1]Reply[/pid] Post by [uid=60979982]荀玥[/uid] (2020-12-09 16:50):

所以不能单纯看cuda核心数量来判断两代显卡的性能差距嘛?[s:ac:茶][/quote]不能 只能同代卡可以这么粗略比较
FrostScale-avatar

FrostScale

[quote][pid=475159237,24557614,1]Reply[/pid] Post by [uid=62165221]我要开小号A[/uid] (2020-12-09 16:51):

ppc肯定有

ipc不清楚[/quote]ppc是什么?[s:ac:羡慕]
?Phoenix?-avatar

?Phoenix?

[img]https://img.nga.178.com/attachments/mon_202012/09/9aQ5-867sK13.png.medium.jpg[/img][img]https://img.nga.178.com/attachments/mon_202012/09/9aQ5-8xpmK13.png.medium.jpg[/img]
安培和图灵架构本身就有区别 它们计算cuda数目的方式也有略微不同
FrostScale-avatar

FrostScale

[quote][pid=475161113,24557614,1]Reply[/pid] Post by [uid=41920800]lucarina[/uid] (2020-12-09 16:57):

[img]https://img.nga.178.com/attachments/mon_202012/09/9aQ5-867sK13.png.medium.jpg[/img][img]https://img.nga.178.com/attachments/mon_202012/09/9aQ5-8xpmK13.png.medium.jpg[/img]
安培和图灵架构本身就有区别 它们计算cuda数目的方式也有略微不同 不同就在那个FP32/INT32通用核心上

至于10系的帕斯卡 对比起20和30 那就完全是另一个东西了
[img]./mon_202012/09/9aQ5-hy0mK26.png.medium.jpg[/im[/quote]图片看着好像没什么区别[s:ac:哭笑],我只知道30系是把int32也算作cuda,所以翻倍了
?Phoenix?-avatar

?Phoenix?

[quote][pid=475166192,24557614,1]Reply[/pid] Post by [uid=60979982]荀玥[/uid] (2020-12-09 17:12):

图片看着好像没什么区别[s:ac:哭笑],我只知道30系是把int32也算作cuda,所以翻倍了[/quote]int32算cuda的理论 实际cuda是标称的75% 没有翻倍那么夸张
M A G A R O-avatar

M A G A R O

IPC的I指的是指令,从一般意义上说指的是相对高层的操作指令,ISA层面的,所以IPC是针对整个架构来说的,对于GPU芯片而言可以考察IPC概念,但因为GPU没有类似于X86一样的标准指令集概念,所以这个IPC可能更有意义的应该是APC,即每个时钟周期能处理的API数量?我随便说的。

但CUDA本身属于执行单元,并不涉及IPC,或者说IPC对于执行单元来说意义不大。执行单元执行的是操作(OP),是用于完成一个指令的基本步骤,所以对于执行单元而言一般是计算其吞吐量,就是看每个周期能做多少个操作,所以你看到的更多的单位是FLOPS,即浮点操作数。
FrostScale-avatar

FrostScale

[quote][pid=475192439,24557614,1]Reply[/pid] Post by [uid=34962610]haruspex[/uid] (2020-12-09 18:43):

IPC的I指的是指令,从一般意义上说指的是相对高层的操作指令,ISA层面的,所以IPC是针对整个架构来说的,对于GPU芯片而言可以考察IPC概念,但因为GPU没有类似于X86一样的标准指令集概念,所以这个IPC可能更有意义的应该是APC,即每个时钟周期能处理的API数量?我随便说的。

但CUDA本身属于执行单元,并不涉及IPC,或者说IPC对于执行单元来说意义不大。执行单元执行的是操作(OP),是用于完成一个指令的基本步骤,所以对于执行单元而言一般是计算其吞吐量,就是看每个周期能做多少个操作,[/quote]所以不同架构的显卡即便cuda核心数一样flops也不一样嘛?[s:ac:茶]
Zar-avatar

Zar

[quote][pid=475193003,24557614,1]Reply[/pid] Post by [uid=60979982]荀玥[/uid] (2020-12-09 18:45):

所以不同架构的显卡即便cuda核心数一样flops也不一样嘛?[s:ac:茶][/quote][s:a2:不明觉厉]这不是必须得,不然无脑摊大饼就完事了
FrostScale-avatar

FrostScale

[quote][pid=475193637,24557614,1]Reply[/pid] Post by [uid=38330363]就赢一手一包五橙[/uid] (2020-12-09 18:48):

[s:a2:不明觉厉]这不是必须得,不然无脑摊大饼就完事了[/quote]盘子就那么大,饼不能无限大呀[s:a2:诶嘿]
Vilkatis-avatar

Vilkatis

显卡现在还不是通用处理器,你用现在统一流处理器的显卡做通用计算的时候也只是用到了显卡芯片的一部分

浮点性能还不能反应显卡的游戏性能
M A G A R O-avatar

M A G A R O

Reply to [pid=475193003,24557614,1]Reply[/pid] Post by [uid=60979982]荀玥[/uid] (2020-12-09 18:45)
当然可以啊。而且其实CUDA CORE这玩意儿现在到底还是不是实际以一个STREAMING PROCESSOR形式存在都不知道了,最早的G80的确是有SP这个单元的,一个SP单元包含一组FP执行单元和一组INT执行单元,一个SM有8个SP,2个SM组成一个TPC,一个GPU有8个TPC。但最新的Amphere的架构已经不是TPC-SM-SP了,改成了GPC-SM,每个SM下又分了四组INT/FP单元池,已经不像以前把一个INT和一个FP做成一个SP单元了,现在的CUDA core数量更像是通过INT或者FP单元的数量,等效折算成早期SP/CUDA CORE数量的一个结果,所以AMPERE架构的CUDA核心数量暴涨到一万多个,也是因为老黄在一个SM里翻倍了FP单元但没有翻倍INT单元,导致折算率变化了的结果。
FrostScale-avatar

FrostScale

[quote][pid=475196825,24557614,1]Reply[/pid] Post by [uid=34962610]haruspex[/uid] (2020-12-09 19:01):

当然可以啊。而且其实CUDA CORE这玩意儿现在到底还是不是实际以一个STREAMING PROCESSOR形式存在都不知道了,最早的G80的确是有SP这个单元的,一个SP单元包含一组FP执行单元和一组INT执行单元,一个SM有8个SP,2个SM组成一个TPC,一个GPU有8个TPC。但最新的Amphere的架构已经不是TPC-SM-SP了,改成了GPC-SM,每个SM下又分了四组INT/FP单元池,已经不像以前把一个INT和一个FP做成一个SP单元了,现在的CUDA core数量更像是通过I[/quote]30系不是因为int32即可以做int运算,也可以做fp运算,所以cuda cores才翻倍的嘛?
M A G A R O-avatar

M A G A R O

[quote][pid=475200347,24557614,1]Reply[/pid] Post by [uid=60979982]荀玥[/uid] (2020-12-09 19:17):

30系不是因为int32即可以做int运算,也可以做fp运算,所以cuda cores才翻倍的嘛?[/quote]不,是增加了FP单元。然后老黄按FP数量折算CUDA,其实INT不够那个数字的……[s:ac:哭笑]
Been Drippin-avatar

Been Drippin

[quote][pid=475193809,24557614,1]Reply[/pid] Post by [uid=60979982]荀玥[/uid] (2020-12-09 18:49):

盘子就那么大,饼不能无限大呀[s:a2:诶嘿][/quote]不同架构下的单元规模本身也不一样
xlx233xlx-avatar

xlx233xlx

6900xt 5120打平3080 4352