算力卡小道消息一则

deimos-avatar

deimos

2025-05-02T03:09:57+00:00

华为开始向中国客户交付CloudMatrix 384 AI集群,售价据传为英伟达GB200 NVL72系统的三倍

华为最新的CloudMatrix 384 AI集群已开始被中国的科技巨头采纳,据悉客户对该服务器相较英伟达产品的性能表示认可。

华为CloudMatrix 384 AI集群或将威胁英伟达在中国等地区的AI霸主地位

在硬件规格方面,CloudMatrix 384(简称 CM384)AI集群搭载了384颗昇腾910C芯片,并采用“全互联拓扑”架构。华为通过增加芯片数量(是英伟达GB200的五倍)来弥补制程和架构上的不足。据称,CloudMatrix集群可实现300 PetaFLOPS的BF16算力,几乎是GB200 NVL72的两倍。不过,CM384的主要短板在于功耗。其能耗约为GB200 NVL72的若干倍,在AI工作负载下的能效比被形容为“相当糟糕”。

更值得注意的是,据说单套CloudMatrix 384 AI集群的报价高达800万美元,几乎是英伟达GB200 NVL72系统的两倍多(当然最终成交价未知)。但由此可见,华为的核心目的并非追求性价比,而是打造一款完全自主可控、足以与西方替代方案正面对抗的高端AI产品。

省流总结:
优点:自主可控,昇腾单卡性能并非国内最强(寒武纪等纸面数据比昇腾海强),但是集群性能全球唯二,国内的厂商目前做不到此等规模的集群。通讯是牢厂的强项,根据论文显示后面还有万卡集群正在突破。
缺点:产能受限,良率受限 啥啥都受限 ,就算是对比皮衣黄也是贵的一笔 牢厂不坑穷人 ,实在是有点费电 国内电多但是电力成本在AI算力中心占比并不低
这里再次呼吁,广大国内科技公司,在这个赛道上多努努力,实现科技平权。什么小家电新能车白色家电之类的东西国内已经卷出天际了,净利率低的令人发指,一起去赚高科技的钱它不香吗?君不见寒武纪那么点营收,市场都愿意给3000亿的估值。
gomgom-avatar

gomgom

国内科技公司真卷不动。
参考黑厂下架的芯片项目。
TerrorLT-avatar

TerrorLT

一套完整的 CloudMatrix 系统现在可提供 300 PFLOPs 的密集 BF16 计算能力,几乎是 GB200 NVL72 的两倍。凭借超过 3.6 倍的总内存容量和 2.1 倍的内存带宽,华为和中国现已拥有能够超越英伟达的 AI 系统能力。”。代价是3.9倍的功耗。
性能接近两倍,功耗接近四倍,就看美国的发电成本是不是我们两倍了
🥀 𝔸ℕℕ𝕀ℍ𝕀𝕃𝔸𝕋𝕀𝕆ℕ ⚰-avatar

🥀 𝔸ℕℕ𝕀ℍ𝕀𝕃𝔸𝕋𝕀𝕆ℕ ⚰

用基建和能源优势拉平算力是挺合理的策略。
TerrorLT-avatar

TerrorLT

最大的亮点是全域自研的 UB-MESH。这个系统非常有趣,它包括CPU、NPU、Mesh交换机等所有设备,全部采用统一的Ub协议。这极大的降低了上层驱动栈的开销成本,同时所有的通讯节点都是对等的,CPU 和 NPU 都有冗余备份。所以它才能被称作“超节点”。可以说 910C 除了是大号 910B 不支持 triton,cube 和 vector 只能靠 l2 通讯没有肉眼可见的缺点。此外,华为还拥有强大的工程能力。这个系统的光纤和铜缆量密度相当高,对散热也有很大的挑战,但这只是华为的常规操作。



知乎网友评论
atow-avatar

atow

哭笑这是回到了熟悉的“力大飞砖”+“规模化”模式
luh preezy-avatar

luh preezy

老黄新阉割的计算卡国内也快出货了哭笑
LiquidDeath358-avatar

LiquidDeath358

消息是真的,有一定积极作用,但是我关注到的业内人认为作用不太大。最主要原因是产能不够,这么大的卡集群浪费smic的产能,增加扩产速度不如出920的速度