FOF TypicallySteven
2025-06-18T04:40:42+00:00
我现在用的是卡诺基RTX A3000 laptop 12G,魔改卡,笔记本GPU魔改到台式机显卡上。
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-khfeZhT1kShs-12i.jpg[/img]
待机60W,满载150W左右,显卡有显示输出,还支持AVI编码解码,
专业卡核心tensor数量翻倍,位宽192,带宽336,导致bf16性能强,适合炼丹。
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-3nceZmT3cSlc-sg.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-fix3ZgT3cSlc-sg.jpg[/img]
跑flux 20步,1K分辨率,67秒。
对比5060ti 76秒 更快。(50系驱动估计有问题)
比4060ti 44秒左右慢。
但是1000元对比4060tti16g 2900元
5060ti 16g 3900元,
性价比拉满。
1152x1536分辨率出图,则是2分钟一张,这一点就比16G的显卡差太多了。
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-9zsfZaT3cSsg-lc.jpg[/img]
训练能够训练1k分辨率分桶大图,刚好11.9G显存左右占用,刚好满足flux训练。(4060ti 16g理论上能训练1152x1536大图分桶)
4000步18小时也即1000步4.5小时左右,以前p104 1000步要17小时,还只是0.5k分辨率,
训练1k分辨率本身比0.5k慢差不多一倍。
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-3ys1ZsT3cSsg-lc.jpg[/img]
现在搞nunchaku,看看速度能有多快。更换显卡后一大堆依赖库和插件爆错,都要重新编译重新部署。
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-7gk2ZkT3cSsg-lc.jpg[/img]
显卡比较重,是金属背板,最好搞个支撑柱。
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-7svjK1uT3cSr8-go.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-h5t8ZbT3cSsg-lc.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-43ezZgT3cSsg-lc.jpg[/img]
不知是不是魔改驱动问题,打不开TCC模式,禁用驱动程序签名能安装最新驱动,可能可以吧。
显示器接到主板上用核显输出,应该能再省几百m显存吧。
由于E3平台只支持pcie3.0x16,跑不满显卡支持的4.0x16,
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-22kjZfT3cSlc-sg.jpg[/img]
这个魔改卡有两个版本,一个是核心频率低,但显存频率高有1700+,带宽336G,适合跑AI和训练,带宽高反向传播速度快。
另一个版本是主频950左右,但显存频率降到1300+左右,显存带宽降到264,这个版本显存带宽会制约AI,但是高频适合打游戏,游戏帧数预计会比低频但高带宽版高10帧左右。
问题是店家不支持指定版本,只能随机发货抽卡。。
理论上更换12代平台,跑满pcie4.0x16,大概能提升10%,再加上开启Resizable RAR又提升10%,叠加起来快20%游戏性能了吧。CPU从E3换成12代又翻倍。最好是ddr5版的主板和内存,更翻倍,反正现在d4内存150元,d5内存180元,主板又同价。
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-khfeZhT1kShs-12i.jpg[/img]
待机60W,满载150W左右,显卡有显示输出,还支持AVI编码解码,
专业卡核心tensor数量翻倍,位宽192,带宽336,导致bf16性能强,适合炼丹。
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-3nceZmT3cSlc-sg.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-fix3ZgT3cSlc-sg.jpg[/img]
跑flux 20步,1K分辨率,67秒。
对比5060ti 76秒 更快。(50系驱动估计有问题)
比4060ti 44秒左右慢。
但是1000元对比4060tti16g 2900元
5060ti 16g 3900元,
性价比拉满。
1152x1536分辨率出图,则是2分钟一张,这一点就比16G的显卡差太多了。
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-9zsfZaT3cSsg-lc.jpg[/img]
训练能够训练1k分辨率分桶大图,刚好11.9G显存左右占用,刚好满足flux训练。(4060ti 16g理论上能训练1152x1536大图分桶)
4000步18小时也即1000步4.5小时左右,以前p104 1000步要17小时,还只是0.5k分辨率,
训练1k分辨率本身比0.5k慢差不多一倍。
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-3ys1ZsT3cSsg-lc.jpg[/img]
现在搞nunchaku,看看速度能有多快。更换显卡后一大堆依赖库和插件爆错,都要重新编译重新部署。
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-7gk2ZkT3cSsg-lc.jpg[/img]
显卡比较重,是金属背板,最好搞个支撑柱。
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-7svjK1uT3cSr8-go.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-h5t8ZbT3cSsg-lc.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-43ezZgT3cSsg-lc.jpg[/img]
不知是不是魔改驱动问题,打不开TCC模式,禁用驱动程序签名能安装最新驱动,可能可以吧。
显示器接到主板上用核显输出,应该能再省几百m显存吧。
由于E3平台只支持pcie3.0x16,跑不满显卡支持的4.0x16,
[img]https://img.nga.178.com/attachments/mon_202506/23/9aQkm0-22kjZfT3cSlc-sg.jpg[/img]
这个魔改卡有两个版本,一个是核心频率低,但显存频率高有1700+,带宽336G,适合跑AI和训练,带宽高反向传播速度快。
另一个版本是主频950左右,但显存频率降到1300+左右,显存带宽降到264,这个版本显存带宽会制约AI,但是高频适合打游戏,游戏帧数预计会比低频但高带宽版高10帧左右。
问题是店家不支持指定版本,只能随机发货抽卡。。
理论上更换12代平台,跑满pcie4.0x16,大概能提升10%,再加上开启Resizable RAR又提升10%,叠加起来快20%游戏性能了吧。CPU从E3换成12代又翻倍。最好是ddr5版的主板和内存,更翻倍,反正现在d4内存150元,d5内存180元,主板又同价。