cheems
2021-10-08T06:45:39+00:00
兄弟们,我来求救了[img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bcad49530.png[/img][img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bcad49530.png[/img]。
目前单位打算采购两台深度学习的服务器或者工作站,目前打算每台上两个A6000,然后内存512g,4t 的ssd。
由于小弟对于深度学习了解的不是很足,cpu方面怎么选,厂家推荐了amd 的3995wx,64核的,会不会这个cpu拉太高了[img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc521c04b.png[/img][img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc521c04b.png[/img][img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc521c04b.png[/img],深度学习图像方面对cpu的要求高吗
求大佬们指点磨蹭[img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc80140e3.png[/img][img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc80140e3.png[/img]
[s:ac:茶]来这问略超纲了
[s:a2:不明觉厉]cpu高不高看项目构成,就是这个时间点有点尴尬
[quote][pid=557164644,28902017,1]Reply[/pid] Post by [uid=38330363]就赢一手一包五橙[/uid] (2021-10-11 14:54):
[s:ac:茶]来这问略超纲了
[s:a2:不明觉厉]cpu高不高看项目构成,就是这个时间点有点尴尬[/quote]主要是目前项目也没有定,主要是图像处理研究方面[img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc7d91913.png[/img][img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc7d91913.png[/img]
3995对得起A6000的价,没啥问题
需要注意的是,amd需要装openblas的计算库而不要用intel的mkl库,性能低不少
然后你这个配置有点散装了,建议还是看一下hp、dell专门的工作站。虽然单价高,但是稳定性有保障;退一步就算稳定性不行,也有个甩锅的
你可以想象一下一个模型训练了一周然后系统崩溃了,啥数据没保存下来,组里的大家会是啥心情……肯定会埋怨你配的不好啊
不考虑上云吗[img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc7a0ee49.png[/img]
cpu多了少了鼠标一拖调一下就完事了
[quote][pid=557165147,28902017,1]Reply[/pid] Post by [uid=1603096]StromEarthFire[/uid] (2021-10-11 14:55):
3995对得起A6000的价,没啥问题
需要注意的是,amd需要装openblas的计算库而不要用intel的mkl库,性能低不少
然后你这个配置有点散装了,建议......[/quote]这个就是从联想那边要来的,我们也是想找品牌的。主要是现在他们的保价有些超预算了[img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc7d91913.png[/img][img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc7d91913.png[/img]
好的cpu还是蛮重要的,不少数据预处理任务都会受益。另外我印象中跑很多模型的时候我自己的3900x cpu在cuda下也会跑到700%多,没研究过深度学习框架代码,但是还好多多益善。毕竟工作可能会很多人同时用
[quote][pid=557165449,28902017,1]Reply[/pid] Post by [uid=5123320]熊吉[/uid] (2021-10-11 14:56):
不考虑上云吗[img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc7a0ee49.png[/img]
cpu多......[/quote][img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc4cc6331.png[/img][img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc4cc6331.png[/img]这个不是我考虑的范围,老大让买
[quote][pid=557165147,28902017,1]Reply[/pid] Post by [uid=1603096]StromEarthFire[/uid] (2021-10-11 14:55):
3995对得起A6000的价,没啥问题
需要注意的是,amd需要装openblas的计算库而不要用intel的mkl库,性能低不少
然后你这个配置有点散装了,建议......[/quote]老哥,你有没有推荐的,目前预算是20w左右[img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc521c04b.png[/img][img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc521c04b.png[/img]小弟我已经懵了
RTX A6000 和3090一个档次,两张卡不算很占用cpu吧
看你优化的怎么样了,做AI训练的话cpu主要用来做数据传输调度,优化好的话两条PCIE4.0X8 5900X绰绰有余。不过还是要看你们算法怎么写。
[quote][pid=557165147,28902017,1]Reply[/pid] Post by [uid=1603096]StromEarthFire[/uid] (2021-10-11 14:55):
3995对得起A6000的价,没啥问题
需要注意的是,amd需要装openblas的计算库而不要用intel的mkl库,性能低不少
然后你这个配置有点散装了,建议还是看一下hp、dell专门的工作站。虽然单价高,但是稳定性有保障;退一步就算稳定性不行,也有个甩锅的
你可以想象一下一个模型训练了一周然后系统崩溃了,啥数据没保存下来,组里的大家会是啥心情……肯定会埋怨你配的不好啊[/quote]按摩店不需要换库就可以吊着英特尔打
英特尔太拉了
楼主可以考虑下昇腾和mindspore
我现在在用,就是没pytorch+cuda好使,不过花的服务蛮好
[quote][pid=557168246,28902017,1]Reply[/pid] Post by [uid=38756827]last orde[/uid] (2021-10-11 15:06):
你用不用双精度啊,要是用要上v100或者A100[/quote]小弟我也不太懂[img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bd2fa0790.png[/img][img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bd2fa0790.png[/img][img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bd2fa0790.png[/img][img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bd2fa0790.png[/img]现在业务还没有开展开,小弟也不知道未来咋用
深度学习因为大量的矩阵并行计算,所以是gpu密集型,cpu相对来说反而不那么重要
[quote][pid=557167467,28902017,1]Reply[/pid] Post by [uid=12511225]wjw397zjy[/uid] (2021-10-11 15:03):
老哥,你有没有推荐的,目前预算是20w左右[img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc521c04b.png[/img][img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc521c04b.png[/img]小弟我已经懵了[/quote]如Ls所说,图像处理cpu没有那么重要。其实内存也没必要这么大,256G基本够了(256内存放不下一般是方法问题)
另外做数据分析的,对内存频率不敏感,所以也没有必要上高频内存。ecc倒是有一定必要
你现在总价报多少,可以看看有没有精简的。一般hp、dell网上的报价都可以打折,我上次是65还是67折,便宜不少
Reply to [pid=557169403,28902017,1]Reply[/pid] Post by [uid=41724327]萌萌哒的煎蛋卷丶[/uid] (2021-10-11 15:09)
阿特拉斯就踏马华为自己的零星几款服务器能适配,技术文档零散支持约定于无。
你就两块卡,CPU是有点高了,64核128线程……
深度学习按1gpu:16线程配置就够了,减一点都可以。要同时兼顾其他非GPU任务的话,这个也行。
如果预算够就上满,反正主板的卡槽有剩,后面显卡降价了要升级加多点卡也方便。
GPU有一定需求,库编译,数据处理什么的,卡起来真的蛋疼。