算力卡小道消息一则

deimos

2025-05-02T03:09:57+00:00

华为开始向中国客户交付CloudMatrix 384 AI集群，售价据传为英伟达GB200 NVL72系统的三倍

华为最新的CloudMatrix 384 AI集群已开始被中国的科技巨头采纳，据悉客户对该服务器相较英伟达产品的性能表示认可。

华为CloudMatrix 384 AI集群或将威胁英伟达在中国等地区的AI霸主地位

在硬件规格方面，CloudMatrix 384(简称 CM384)AI集群搭载了384颗昇腾910C芯片，并采用“全互联拓扑”架构。华为通过增加芯片数量(是英伟达GB200的五倍)来弥补制程和架构上的不足。据称，CloudMatrix集群可实现300 PetaFLOPS的BF16算力，几乎是GB200 NVL72的两倍。不过，CM384的主要短板在于功耗。其能耗约为GB200 NVL72的若干倍，在AI工作负载下的能效比被形容为“相当糟糕”。

更值得注意的是，据说单套CloudMatrix 384 AI集群的报价高达800万美元，几乎是英伟达GB200 NVL72系统的两倍多(当然最终成交价未知)。但由此可见，华为的核心目的并非追求性价比，而是打造一款完全自主可控、足以与西方替代方案正面对抗的高端AI产品。

省流总结:
优点:自主可控，昇腾单卡性能并非国内最强(寒武纪等纸面数据比昇腾海强)，但是集群性能全球唯二，国内的厂商目前做不到此等规模的集群。通讯是牢厂的强项，根据论文显示后面还有万卡集群正在突破。
缺点:产能受限，良率受限啥啥都受限，就算是对比皮衣黄也是贵的一笔牢厂不坑穷人，实在是有点费电国内电多但是电力成本在AI算力中心占比并不低
这里再次呼吁，广大国内科技公司，在这个赛道上多努努力，实现科技平权。什么小家电新能车白色家电之类的东西国内已经卷出天际了，净利率低的令人发指，一起去赚高科技的钱它不香吗？君不见寒武纪那么点营收，市场都愿意给3000亿的估值。

gomgom

国内科技公司真卷不动。
参考黑厂下架的芯片项目。

TerrorLT

一套完整的 CloudMatrix 系统现在可提供 300 PFLOPs 的密集 BF16 计算能力，几乎是 GB200 NVL72 的两倍。凭借超过 3.6 倍的总内存容量和 2.1 倍的内存带宽，华为和中国现已拥有能够超越英伟达的 AI 系统能力。”。代价是3.9倍的功耗。
性能接近两倍，功耗接近四倍，就看美国的发电成本是不是我们两倍了

🥀 𝔸ℕℕ𝕀ℍ𝕀𝕃𝔸𝕋𝕀𝕆ℕ ⚰

用基建和能源优势拉平算力是挺合理的策略。

TerrorLT

最大的亮点是全域自研的 UB-MESH。这个系统非常有趣，它包括CPU、NPU、Mesh交换机等所有设备，全部采用统一的Ub协议。这极大的降低了上层驱动栈的开销成本，同时所有的通讯节点都是对等的，CPU 和 NPU 都有冗余备份。所以它才能被称作“超节点”。可以说 910C 除了是大号 910B 不支持 triton，cube 和 vector 只能靠 l2 通讯没有肉眼可见的缺点。此外，华为还拥有强大的工程能力。这个系统的光纤和铜缆量密度相当高，对散热也有很大的挑战，但这只是华为的常规操作。

知乎网友评论

atow

这是回到了熟悉的“力大飞砖”+“规模化”模式

luh preezy

老黄新阉割的计算卡国内也快出货了

LiquidDeath358

消息是真的，有一定积极作用，但是我关注到的业内人认为作用不太大。最主要原因是产能不够，这么大的卡集群浪费smic的产能，增加扩产速度不如出920的速度

算力卡能买么？锁算力卡什么时候到位，不然只能上2060了有没有发现，最近30系锁算力卡，都是七彩虹，其他品牌很少见锁了一单70锁算力卡好纠结想问下最近出的30系锁算力卡会是矿卡回炉翻新吗锁算力的卡刷了高规格的bios也解不了电流墙锁算力的卡100%破解了 3070ti 低算力的卡，会有锻炼过么两张锁算力的卡留哪张啊

返回主页