Serath
2021-03-18T10:02:03+00:00
朋友做研究要用,导师给的预算5W。
[img]https://img.nga.178.com/attachments/mon_202103/20/9aQj11-50dcKhT3cSms-2j.jpg[/img]
可以两张3090最好,不过现在不好买。
给个思路,买不到3090可以买丽台rtx5000之类的专业卡,虽然性价比一般但是有货有保修
[url]https://lulaoshi.info/gpu/gpu-basic/2020-gpu.html[/url]
人工智能研究者应该选择哪款显卡?
本页内容
消费级
企业级
小结
配套源码
2020 年,什么样的 GPU 才是人工智能训练的最佳选择?
上一节我们曾简单介绍英伟达为优化深度学习的矩阵运算,在较新的微架构中,专门设计了Tensor Core这样的混合精度核心,因此,人工智能训练最好选择带有Tensor Core的GPU。
众所周知,当今业界领先(State-of-the-art)的深度学习模型都会占用巨大的显存空间,很多过去性能算得上强劲的 GPU,现在可能稍显内存不足。Lambda实验室2020年2月发布了一篇显卡横向测评文章,探讨了哪些GPU可以在不出现内存错误的情况下训练模型。核心结论是,显存大小非常重要。是的,显存大小正在制约着很多深度学习模型的训练。
因为深度学习技术的突飞猛进,以前 12G 内存打天下的局面不复存在了。2020 年 2 月,你至少需要花费 2500 美元买上一块英伟达最新款的 Titan RTX 才可以勉强跑通业界性能最好的模型——那到今年年底会是什么样就无法想象了。
消费级Permalink
对于个人用户,英伟达消费级的GeForce系列是首选。比较经济的选项有:
GeForce RTX 2080 Ti:1200美元,11GB显存,Turing微架构(支持Tensor Core)
Titan RTX:2500美元,24GB显存, Turing微架构(支持Tensor Core)
需要注意的是,这些消费级显卡对多卡并行支持不好,默认情况,他们不支持多卡间直接通信,如果我们希望卡1和卡2之间相互通信,那么数据通过PCI-E总线在多卡之间通信,这种方式不利于多卡之间的通信。2080 Ti和Titan RTX对于多卡之间PCI-E通道的P2P(Peer-to-Peer)通信支持并不好,但并不意味着他们不支持NVLink,用户可以通过购买NVLink桥接器来构建多卡之间的通信通道。有人称这个问题是这两款GPU的设计缺陷,也有人认为英伟达有意为之,为的是让有多卡并行计算需求的人去购买Telsa系列GPU。
企业级Permalink
数据中心的GPU产品更贵,适合企业级用户,它们的显存更高,也可以更好地支持多卡并行。
Quadro RTX 6000:4000美元,24GB显存,Turing微架构(支持Tensor Core)
Quadro RTX 8000:5500美元,48GB显存,Turing微架构(支持Tensor Core)
Telsa V100:16或32GB显存两个版本,PCI-E和NVLink两个版本,Volta微架构(支持Tensor Core)
Telsa V100S:32GB显存,PCI-E总线,Volta微架构(支持Tensor Core)
企业级的GPU一般都必须插到服务器或工作站上,这些服务器和工作站本身也不便宜,尤其是支持Telsa平台的服务器在十万元级别。当然,这里没有考虑机房建设、电费等成本。
2020年5月英伟达GTC 2020上发布了新一代Ampere微架构以及Telsa A100显卡,A100显卡的人工智能训练和推理能力更强,而且单个A100可以被分割成最多7个独立GPU来处理各种计算任务。
有多卡并行训练任务的朋友,建议选择支持NVLink的Telsa系列显卡。
小结Permalink
如果进行深度学习研究,GeForce RTX 2080 Ti(11GB)可能是起步标配;Titan RTX(24GB)是个不错的选项,兼顾了价格、显存和计算性能。对于企业级用户,Quadro RTX 8000(48GB)、Telsa V100(32GB)等显卡适合深度学习领域的前沿研究人员。2020年下半年,英伟达新的计算平台即将出货,新产品一方面会带来更强大的性能,另一方面也会使现有产品降价。
在物理硬件昂贵的当下,或许我们应该把目光转向云端GPU。
5w组一台电脑肯定没问题,海鲜市场淘两张七彩虹3090就好,不到5w吧 剩下的钱再买其他配件。反正支持个人送保。[s:a2:有何贵干]
Reply to [pid=501720846,25990128,1]Reply[/pid] Post by [uid=42108057]UCHIHA_ITACHI1[/uid] (2021-03-20 18:05)有通。这卡性能是怎么说。
Reply to [pid=501722428,25990128,1]Reply[/pid] Post by [uid=359741]比尔盖次[/uid] (2021-03-20 18:13)害,要是能有新卡就好了。
Reply to [pid=501723193,25990128,1]Reply[/pid] Post by [uid=42420463]巨龙骑士尹志平[/uid] (2021-03-20 18:17)下面改口了。
Reply to [pid=501721328,25990128,1]Reply[/pid] Post by [uid=731907]wking1027[/uid] (2021-03-20 18:07)这就叫专业.jpg
Reply to [pid=501725997,25990128,1]Reply[/pid] Post by [uid=60889126]Magina2233[/uid] (2021-03-20 18:31)还是全新卡好一点吧。泰坦现在肯定没全新的。想去线下看看有没有卡。
[img]https://img.nga.178.com/attachments/mon_202103/20/9aQj11-jxwuK2bT3cStd-e5.jpeg.medium.jpg[/img]
对着这个看吧,再想想自己模型的大小最小显存要多少
两张3090差不多了,考虑到涡轮卡和4槽pcie间隔主板较贵,可以选择一张直插一张pcie延长线竖装的思路
5W足够上3090了,CPU和主板看你以后有没有上四卡或者多硬盘的需求。有的话就买线程撕裂者(二系就行,有钱的话上三系);没有的话随便买个有两条直通CPU的PCIe插槽的主板,X570大多都有,B550一般就需要转接卡了。
另外双3090有可能互相烤,最好买涡轮卡或者请人改水冷。
内存的话,看你纠不纠结ECC,纠结的话买纯ECC内存(注意主板要支持,华硕一般都支持);不纠结的话随便买,3200Mhz就行。为了稳定不建议超频,也不建议买2666的(颗粒太烂的话,插满四根会稳不住2666)。
电源1000W金牌就行。
要求散热好的话,两张3090要么公版要么水冷要么涡轮卡要么开放式机箱,现在的3090发热可怕,随便开个游戏显存温度直升90度,更别说做渲染要24小时开着了