[转载]如何用14nm造出Exascale超算

OwerGrowen-avatar

OwerGrowen

2022-03-15T09:24:42+00:00

[url]https://www.nextplatform.com/2022/03/11/pondering-the-cpu-inside-chinas-sunway-oceanlight-supercomputer/[/url]
神威系列又出新产品了,神威海洋之光,处理器是SW26010-Pro(中芯14nm,看来去美14nm已经能量产了),太湖之光用的SW20610是28nm,上面跑了个预训练机器学习模型,名为八卦炉(BaGuaLu,真就用八卦炉炼丹[s:ac:哭笑])

[img]https://img.nga.178.com/attachments/mon_202203/15/9aQ8mbp-by5mZfT1kSgc-d2.jpg[/img]
SW20610-Pro的计算引擎如图所示,其中一个处理器里有六个核心组,每个核心组里有一个管理单元,管着4*4=16组计算处理单元,每个单元中有4个计算单元,其中一部分支持FP64/32,另一部分支持FP16/BF16,每个计算处理单元共享256k的L2缓存,核心组通过DDR4内存控制器与内存交互,一个组有16GB的内存,带宽51.4GB/s,也就是单处理器96G内存,307.2GB/s内存带宽,六个核心组之间用环形总线连接,有两个网络互联端口与其他处理器互联(太湖之光用的是Infiniband)。

单处理器是14.03Tflops(FP64/32)或者55.3Tflops(BF16/FP16),八卦路模型用了105机柜,总共107250个处理器,合计1.51 Exaflops,加入扩展到160机柜,峰值FP64/32就是2.3EFlops,120机柜就是1.72EFlops,按160机柜配置,峰值性能超过了橡树岭的Frontier(1.5EFlops)和Aurora(2 Eflops),甚至可能超过2023年上限的El Capitan(2.2-2.3EFlops)。

14nm最大的问题还是发热和能源消耗(嘛,反正兔子不缺[s:ac:哭笑]),美国的超算则是往能耗比方向去的
NR-X Gremy-avatar

NR-X Gremy

隐藏的意思就是说中芯14nm流片出来了?
都是好事
GoobeyGoobs-avatar

GoobeyGoobs

下面有评论说这个的内存带宽太低 每flops带宽只有竞品的1/15-1/6 很多情况下运算性能会受限 并暗示这个只是为了刷top500榜而生产的产品
OwerGrowen-avatar

OwerGrowen

Reply to [pid=595814574,31067386,1]Reply[/pid] Post by [uid=1698382]死寂天空[/uid] (2022-03-15 19:45)
他特意提了不包括机器学习应用
但这个家伙目前就是拿来跑ML模型的[s:ac:哭笑]
音凜-avatar

音凜

[quote][pid=595810385,31067386,1]Reply[/pid] Post by [uid=33362826]Hina阳菜[/uid] (2022-03-15 19:26):

隐藏的意思就是说中芯14nm流片出来了?
都是好事[/quote]日韩打架,韩国就开始缺洗硅晶片水。
WoIf-avatar

WoIf

我记得有人介绍说sw系列有黑科技的指令级细粒度通信来克服IO瓶颈
RiverDragonz-avatar

RiverDragonz

[quote][pid=595825074,31067386,1]Reply[/pid] Post by [uid=62165221]我要开小号A[/uid] (2022-03-15 20:35):

我记得有人介绍说sw系列有黑科技的指令级细粒度通信来克服IO瓶颈[/quote]飞机的话是气动牛逼对抗力大砖飞

最后是气动确实牛逼 但是还是要琢磨力大砖飞怎么做

重点有先后 但是课一门不能少补
INSANATIC RABIOT-avatar

INSANATIC RABIOT

八卦炉这名字可太生草了[s:ac:哭笑]
deevicam46-avatar

deevicam46

[quote][pid=595870742,31067386,1]Reply[/pid] Post by [uid=42745287]sky要好好写代码_[/uid] (2022-03-16 00:22):

八卦炉这名字可太生草了[s:ac:哭笑][/quote][s:ac:哭笑] 炼丹!
Prodigy-avatar

Prodigy

[quote][pid=595810385,31067386,1]Reply[/pid] Post by [uid=33362826]Hina阳菜[/uid] (2022-03-15 19:26):

隐藏的意思就是说中芯14nm流片出来了?
都是好事[/quote]20年就成功了吧
Yac-avatar

Yac

单处理器14P?14T吧
EnigmaX-avatar

EnigmaX

啥架构的?不知道单颗性能怎么样[s:a2:不明觉厉]
AIcey-avatar

AIcey

这种超算搭起来肯定是自带发电站的 接电网负荷有点大。。。
OwerGrowen-avatar

OwerGrowen

[quote][pid=595874370,31067386,1]Reply[/pid] Post by [uid=42549807]山胤[/uid] (2022-03-16 00:43):

单处理器14P?14T吧[/quote]The SW26010-Pro is rated at 14.03 petaflops at either FP64 or FP32 precision and 55.3 petaflops at BF16 or FP16 precision.

估计原文就写错了,应该是14t,我改下主楼
OwerGrowen-avatar

OwerGrowen

[quote][pid=595874390,31067386,1]Reply[/pid] Post by [uid=39658527]苹果质量效应[/uid] (2022-03-16 00:44):

啥架构的?不知道单颗性能怎么样[s:a2:不明觉厉][/quote]老规矩 爆改的DEC Alpha 跟太湖之光一样
OwerGrowen-avatar

OwerGrowen

[quote][pid=595873060,31067386,1]Reply[/pid] Post by [uid=43079159]我觉得还行_[/uid] (2022-03-16 00:36):

20年就成功了吧[/quote]能供超算说明有了量产的能力,这个比实验室里小规模做重要的多
接下来就等纯国产14了,这个我估计大概率是去美14