这两天看到有很多同学说,M1 Pro/Max不支持cuda不能炼丹,没有生产力

Hemp Clone-avatar

Hemp Clone

2021-10-15T23:22:13+00:00

(推荐的看帖方式:看下标题,不感兴趣,X;太长,X;感兴趣,看正文,回复。
不推荐的看帖方式:看下标题,看下评论风向,开喷! )

如果你还没有分配到GPU,可以试试Google Colab和Kaggle,这俩都是可以给你白嫖GPU使用的。

白嫖GPU


Colab的免费版,提供一个12gb显存的k80,可以最长连续使用12小时,之后可以在申请。(很多人分享代码也喜欢在colab里面,不知道为啥在NGAer眼里colab一文不值)。
Kaggle提供每周41小时的16gb的P100,没有连续使用限制。而且Kaggle还有30小时的TPU使用时间,合起来就是71小时了,事实上,大部分人一周也用不到这么多时间,尤其是还打算用笔记本炼丹的同学。缺点就是,如果notebook一段时间不活跃会被掐掉。
(对,P100还没有3060跑得快,但是显存大了一倍)

应该还有很多类似的东西,比如说之前腾讯搞得广告算法大赛,直接给你白嫖2个月的V100,其实是有时限的,每段时间给你发个千元代金券,如果没比赛自己买还是贵的。

而且用云笔记本有个好处就是,你基本上不需要额外花时间配置环境,而且下载数据集的速度可能比你自己的电脑快很多,然后就是不需钱了

云notebook不等同于云游戏,延迟不是很影响体验。就算是使用本地设备,多半也是要和notebook打交道的,缺点就是装不了插件(或许可以),调试麻烦...

本地训练


至于在mac/macbook上训练模型,模型训练加速相关,TF是有支持的,不过我个人没有用过。所以对于相关的libraries支持情况我也不是很了解,比如说huggingface这些。

下面是M1芯片加速训练神经网络与N卡的对比。
[url]https://www.reddit.com/r/MachineLearning/comments/kwqev4/d_comparing_performance_on_apples_m1_with_nvidias/[/url]
[url]https://wandb.ai/vanpelt/m1-benchmark/reports/Can-Apple-s-M1-help-you-train-models-faster-cheaper-than-NVIDIA-s-V100---VmlldzozNTkyMzg[/url]
[quote]We ran a sweep of 8 different configurations of our training script and show that the Apple M1 offers impressive performance within reach of much more expensive and less energy efficient accelerators such as the Nvidia V100 for smaller architectures and datasets.[/quote]当然了,这个benchmark或许不应该当真, 大意是没有用半精度训练,而且benchmark使用模型是玩具尺寸,体现不出大显存的优势。
[quote]What the author essentially did (not using FP16 on FP16 optimized hardware, running batch-size 32 with a small model on a 16/32GB card) is comparable to trying to drive a Ferrari with the handbrake on. Then publish benchmarks about it. WHAT. A. JOKE.[/quote]下周应该就有M1 Max训练模型的测试了。
引用#56楼的话,
[quote]Google自己维护的硬件后端有TPU, AMD维护的是ROCm, 微软维护的是DirectML 苹果维护的是CoreML.[/quote]NVIDIA提供CUDA接口,APPLE有提供ML Compute接口,而TensorFlow有用ML compute加速训练的版本,也支持将macbook gpu通过metal当作pluggableDevice来加速训练。

同时,既然是unified memory,意味着超大显存,不知道用来训练网络会有什么效果。
然而,计算终究不是macbook的预期用途,M1 Max或许可以用来满足跑个prototype或者debug的需求。

tensorflow_macos

[quote] TensorFlow users on Intel Macs or Macs powered by Apple’s new M1 chip can now take advantage of accelerated training using Apple’s Mac-optimized version of TensorFlow 2.4 and the new ML Compute framework.[/quote][url]https://blog.tensorflow.org/2020/11/accelerating-tensorflow-performance-on-mac.html[/url]
[url]https://github.com/apple/tensorflow_macos[/url]

tensorflow_metal

[quote]Accelerate training of machine learning models with TensorFlow right on your Mac. Install TensorFlow and the tensorflow-metal PluggableDevice to accelerate training with Metal on Mac GPUs.[/quote][url]https://developer.apple.com/metal/tensorflow-plugin/[/url]
[url]https://blog.tensorflow.org/2021/06/pluggabledevice-device-plugins-for-TensorFlow.html[/url]

然而笔记本有笔记本的用途,长时间训练肯定没有那么舒适,因此能白嫖的云GPU还是不错的替代方案。
Bushneck-avatar

Bushneck

合计着都云炼丹了…那m1 pro/max的cpu/gpu不是更没用了。

买个x1c,键盘更好还轻便方便不香么……。
512CJ-avatar

512CJ

炼丹简直被cuda垄断了
Hemp Clone-avatar

Hemp Clone

Reply to [pid=559800854,29054987,1]Reply[/pid] Post by [uid=151260]lyylts[/uid] (2021-10-20 07:35)这跟用thinkpad还是macbook没关系,单纯是觉得,没必要买台笔记本来炼丹。而且这也不是2块1080ti就能发顶会的时候了。
Big Nate-avatar

Big Nate

炼丹不用台式机?跟笔记本就不在一个领域。

有一说一,迄今为止云算力还是比本地算力贵一个数量级,对企业来说能节省基础设施维护和运维成本,但对个人来说仍然是经济上不划算的。
Miscgamer-avatar

Miscgamer

都云炼丹了,买个CHROMEBOOK 不是更好,还便宜
Hemp Clone-avatar

Hemp Clone

Reply to [pid=559801332,29054987,1]Reply[/pid] Post by [uid=63315103]bestvaliant[/uid] (2021-10-20 07:40)如果你只需要一个终端模拟器,chromebook确实没问题。我之前就玩过chromebook pixel,4:3的屏幕,使用体验还是比大部分win本好得多,而且我只花了1500买到。
Hemp Clone-avatar

Hemp Clone

Reply to [pid=559801294,29054987,1]Reply[/pid] Post by [uid=710269]sylvannus[/uid] (2021-10-20 07:39)写了那么大白嫖两个字了,自然是免费的,我也提到了类似于腾讯搞的那个类似的价格很贵。但是也有colab pro这种可以让你以订阅方式用上V100的服务。同时我也强调了,这是给想买一台能炼丹的笔记本的同学说的,要是有人给你报销,那自然是3090整起来。
XanderRadio-avatar

XanderRadio

colab我的体验就是很不方便,很多数据集太大不好存储(得加钱),想要debug的东西都难以在colab上搞(不好调试),我尝试用了几次,最后都是回到本地服务器上跑模型了。
yNoreht-avatar

yNoreht

这就是买2w5 m1m的理由?
Kafooie-avatar

Kafooie

果粉vs果黑。思路就是这么奇妙

果粉给macbook找用途,努力证明苹果笔电部门那么大利润却依然良心
果黑给用途找配件
Nick123-avatar

Nick123

41个小时能干啥?迭代两轮模稍微复杂点的模型,这还是一周时间,说实话玩玩可以,就是研究生拿来做实验写论文都不够,更不用谈别的了
Nick123-avatar

Nick123

Reply to [pid=559813084,29054987,1]Reply[/pid] Post by [uid=60361344]bf109f4[/uid] (2021-10-20 08:45)根据需求找工具,这是正常人的想法,和果黑有个jb关系?建议苹果别给自己加那么多戏
Zackghost-avatar

Zackghost

[quote][pid=559813084,29054987,1]Reply[/pid] Post by [uid=60361344]bf109f4[/uid] (2021-10-20 08:45):
果粉vs果黑。思路就是这么奇妙
果粉给macbook找用途,努力证明苹果笔电部门那么大利润却依然良心
果黑给用途找配件[/quote][img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc4cc6331.png[/img]别这么苛刻,我现在更好奇,果粉到底现在买 Mac 搞着什么生产力,还是别人说什么他就信什么?

就跟这段时间 ti10 一样,我朋友说这几天吵翻天各种神论,但是问他们有没有客户端就结束了话题
Artem_Valman-avatar

Artem_Valman

果粉还是牛逼啊,都炼丹了我还花2w5去买你个屁用没有的mac[s:ac:呆]
Miscgamer-avatar

Miscgamer

以前分子对接一跑就是一个月,这十几个小时真是用了个寂寞。。。。

这玩意一停就是白干了,就像楼上说的,跑个研究生课题都不够,更别说专业生产了
shanks-avatar

shanks

Reply to [pid=559800854,29054987,1]Reply[/pid] Post by [uid=151260]lyylts[/uid] (2021-10-20 07:35)只能说不适合你,并不能说没用,你觉得什么合适就用什么,没必要说你不用的东西没有用处。
Zula-avatar

Zula

牛逼都上云了 花这么多钱买个显示器
Hemp Clone-avatar

Hemp Clone

Reply to [pid=559817195,29054987,1]Reply[/pid] Post by [uid=63315103]bestvaliant[/uid] (2021-10-20 09:00)所以你觉得正确做法是整个笔记本跑24小时吗?中途init3还是怎么。
shanks-avatar

shanks

Reply to [pid=559813084,29054987,1]Reply[/pid] Post by [uid=60361344]bf109f4[/uid] (2021-10-20 08:45)果粉果黑都要不得。一般买苹果的就是以前用苹果的,一般人转平台都不习惯,一个鼠标加速模式差异就能劝退一大批人。