[转载]如何用14nm造出Exascale超算

OwerGrowen

2022-03-15T09:24:42+00:00

[url]https://www.nextplatform.com/2022/03/11/pondering-the-cpu-inside-chinas-sunway-oceanlight-supercomputer/[/url]
神威系列又出新产品了，神威海洋之光，处理器是SW26010-Pro(中芯14nm，看来去美14nm已经能量产了)，太湖之光用的SW20610是28nm，上面跑了个预训练机器学习模型，名为八卦炉(BaGuaLu，真就用八卦炉炼丹[s:ac:哭笑])

[img]https://img.nga.178.com/attachments/mon_202203/15/9aQ8mbp-by5mZfT1kSgc-d2.jpg[/img]
SW20610-Pro的计算引擎如图所示，其中一个处理器里有六个核心组，每个核心组里有一个管理单元，管着4*4=16组计算处理单元，每个单元中有4个计算单元，其中一部分支持FP64/32，另一部分支持FP16/BF16，每个计算处理单元共享256k的L2缓存，核心组通过DDR4内存控制器与内存交互，一个组有16GB的内存，带宽51.4GB/s，也就是单处理器96G内存，307.2GB/s内存带宽，六个核心组之间用环形总线连接，有两个网络互联端口与其他处理器互联(太湖之光用的是Infiniband)。

单处理器是14.03Tflops(FP64/32)或者55.3Tflops(BF16/FP16)，八卦路模型用了105机柜，总共107250个处理器，合计1.51 Exaflops，加入扩展到160机柜，峰值FP64/32就是2.3EFlops，120机柜就是1.72EFlops，按160机柜配置，峰值性能超过了橡树岭的Frontier(1.5EFlops)和Aurora(2 Eflops)，甚至可能超过2023年上限的El Capitan(2.2-2.3EFlops)。

14nm最大的问题还是发热和能源消耗(嘛，反正兔子不缺[s:ac:哭笑])，美国的超算则是往能耗比方向去的

NR-X Gremy

隐藏的意思就是说中芯14nm流片出来了？
都是好事

GoobeyGoobs

下面有评论说这个的内存带宽太低每flops带宽只有竞品的1/15-1/6 很多情况下运算性能会受限并暗示这个只是为了刷top500榜而生产的产品

OwerGrowen

Reply to [pid=595814574,31067386,1]Reply[/pid] Post by [uid=1698382]死寂天空[/uid] (2022-03-15 19:45)
他特意提了不包括机器学习应用
但这个家伙目前就是拿来跑ML模型的[s:ac:哭笑]

音凜

[quote][pid=595810385,31067386,1]Reply[/pid] Post by [uid=33362826]Hina阳菜[/uid] (2022-03-15 19:26):

隐藏的意思就是说中芯14nm流片出来了？
都是好事[/quote]日韩打架，韩国就开始缺洗硅晶片水。

WoIf

我记得有人介绍说sw系列有黑科技的指令级细粒度通信来克服IO瓶颈

RiverDragonz

[quote][pid=595825074,31067386,1]Reply[/pid] Post by [uid=62165221]我要开小号A[/uid] (2022-03-15 20:35):

我记得有人介绍说sw系列有黑科技的指令级细粒度通信来克服IO瓶颈[/quote]飞机的话是气动牛逼对抗力大砖飞

最后是气动确实牛逼但是还是要琢磨力大砖飞怎么做

重点有先后但是课一门不能少补

INSANATIC RABIOT

八卦炉这名字可太生草了[s:ac:哭笑]

deevicam46

[quote][pid=595870742,31067386,1]Reply[/pid] Post by [uid=42745287]sky要好好写代码_[/uid] (2022-03-16 00:22):

八卦炉这名字可太生草了[s:ac:哭笑][/quote][s:ac:哭笑] 炼丹！

Prodigy

[quote][pid=595810385,31067386,1]Reply[/pid] Post by [uid=33362826]Hina阳菜[/uid] (2022-03-15 19:26):

隐藏的意思就是说中芯14nm流片出来了？
都是好事[/quote]20年就成功了吧

Yac

单处理器14P？14T吧

EnigmaX

啥架构的？不知道单颗性能怎么样[s:a2:不明觉厉]

AIcey

这种超算搭起来肯定是自带发电站的接电网负荷有点大。。。

OwerGrowen

[quote][pid=595874370,31067386,1]Reply[/pid] Post by [uid=42549807]山胤[/uid] (2022-03-16 00:43):

单处理器14P？14T吧[/quote]The SW26010-Pro is rated at 14.03 petaflops at either FP64 or FP32 precision and 55.3 petaflops at BF16 or FP16 precision.

估计原文就写错了，应该是14t，我改下主楼

OwerGrowen

[quote][pid=595874390,31067386,1]Reply[/pid] Post by [uid=39658527]苹果质量效应[/uid] (2022-03-16 00:44):

啥架构的？不知道单颗性能怎么样[s:a2:不明觉厉][/quote]老规矩爆改的DEC Alpha 跟太湖之光一样

OwerGrowen

[quote][pid=595873060,31067386,1]Reply[/pid] Post by [uid=43079159]我觉得还行_[/uid] (2022-03-16 00:36):

20年就成功了吧[/quote]能供超算说明有了量产的能力，这个比实验室里小规模做重要的多
接下来就等纯国产14了，这个我估计大概率是去美14

转载：如何看待宁德时代强制经理级别员工强制购买特斯拉model3？ [转载]如何看待问界m7车主称汽车刹车失灵，并提供了第三方机构的鉴定证明？ [雪球转载]如何看待比亚迪汉EV在碰撞后48小时起火 (转载)看到一段话，如何判断一个政府是否负责 [攻略分享] [授权转载]帝国神话如何识别武将属性辨别极品武将和辣鸡武将的区别避免浪费精力培养辣鸡武将避坑新手必看！ (转载)上网讨论是如何让你变蠢的转载全民疯狂：只有半壁江山的南宋如何制出空前绝后土地兼并豆瓣转载|悬赏十万求如何让老婆回心转意准备转载一个由发车群老哥连载的舔狗日记，如何

返回主页