兄弟们，本地跑32b模型真的没有万元以下的方案吗

Ryder

2025-07-28T09:43:17+00:00

研究好几天了。目前比较看好的方案是双a770，linux系统跑intel魔改版的ollama。不过这一系列操作每一步都是花活。
补充：需求是无网环境用qwen3 coder 30b协助开发
补充2：qwen3 coder是moe模型，是30b a3b需要大显存，不需要大算力。30b参数全部加载到显存，但回答时只有3b参数参与运算
补充3：因为我用的ollama，所以只能pull到q4km版本，占显存21G左右

Foxac

两张v100，换成mi50都不用

Mercuryio

量化啊，万元都可以ktransformers跑ds 671b量化了。。。当然这就是极限压缩组生产力机器了。

一张3090现在只要5000了，然后就处理器多核多线程堆服务器内存吧

F 0 I K

不想收魔改卡可以看看这个[img]https://img.nga.178.com/attachments/mon_202508/06/9aQwcv9-egngZgT3cShs-134.jpg[/img]
128g跑32b应该是够了

opu

有动手能力，能承担风险，捡垃圾镭7搞几张，再自己淘个服务器板。

还有个方案就是amx+ 395 买64g+1t那个版本 9999

tentai

mac mini 48g或者64g？
不知道有没有对应的配置

moonflower

不过32b的需求是什么，32b的llm智商感人，还有q4量化的话，24g显存可以跑

Ryder

[quote][pid=835007435,44783655,1]Reply[/pid] Post by [uid=60395918]落羽沉香[/uid] (2025-08-06 17:55):

不过32b的需求是什么，32b的llm智商感人，还有q4量化的话，24g显存可以跑[/quote]隔离内网的qwen3coder 30b

Mercuryio

Reply to [pid=835007769,44783655,1]Reply[/pid] Post by [uid=62170568]琪亚娜-椅子兰娜[/uid] (2025-08-06 17:58)

不是刚开源了qwen-coder-flash性能损失也不是很多

Ryder

[quote][pid=835008137,44783655,1]Reply[/pid] Post by [uid=37459024]stdemonli[/uid] (2025-08-06 18:00):

不是刚开源了qwen-coder-flash性能损失也不是很多[/quote]兄弟，qwen3coder flash就是qwen3coder 30b

Mercuryio

看了你的需求，建议加预算，极限配置速度快不了，速度慢对生产力毫无帮助。
协助coding你得让他读文件吧，读都要读半天

Kewdop

这预算都可以双5060ti 16g了

Ryder

[quote][pid=835008850,44783655,1]Reply[/pid] Post by [uid=18787939]oovloveme[/uid] (2025-08-06 18:05):

这预算都可以双5060ti 16g了[/quote]32b模型量化了也要22G显存，你这个不够的

moonflower

[quote][pid=835007769,44783655,1]Reply[/pid] Post by [uid=62170568]琪亚娜-椅子兰娜[/uid] (2025-08-06 17:58):

隔离内网的qwen3coder 30b[/quote]那样的话，cpu速度太慢了效率不行，只能考虑纯显卡配置了，建议加预算

Lucas̵̀̆

qwen coder 30b, 万元方案的上下文够吗？我试过4090跑量化版的coder,
感觉上下文长度太小了，稍微长一点的内容，它就卡那了

supersayan_1995

32G就很舒适了，想办法弄出32G+的单卡吧，速度就没办法了，不过32B慢也慢不到哪去

purple1738

3000块钱整一套两卡V100 SXM2 16g外接差不多了。
有需要的话也可以选2卡5060Ti 16g(全新)或者2卡3080 20g。

AssassinoTorino

显卡上 7900xtx？

Miguel_OuO

4张v100，加上转接卡也就不到4000，64G显存跑个32B Q8，上下文拉满，不是随便跑嘛

JayyGrizz

看你ctx window需要多大。不过按照native 256k的话，我只能给你点蜡烛了 [s:ac:哭笑]

[img]https://img.nga.178.com/attachments/mon_202508/06/9aQwcvr-ddbyKzT1kSd7-it.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202508/06/9aQwcvr-3ukyKzT1kSdt-iy.jpg[/img]

兄弟们，本地有个人想用3090水神还我3090火神，换吗？兄弟们，本地加工厂比较中意的门窗价格出来了，因为总价，很多因素有所取舍兄弟们南京本地烟有啥，外地买不到的兄弟们，我被本地群里的一条疯狗咬上了，我好气....怎么办？兄弟们，安卓有啥好用的能看本地局域网上的视频播放软件啊！！兄弟们从咸鱼上买东西需要注意啥，960显卡2g本地自提450元还是去淘宝525元保修3年？ [硬件求助] 兄弟们帮我看一下，本地拿的这对海盗船3600内存是不是有问题，XMP别说3600，3200都不能开机，最多3000 [新闻] 本地新闻一则，典中典啊兄弟们，这个社会对男的太恶意了。。。。。。 (询价)有台9800x3d要求本地自提，兄弟们帮忙看看多少钱拿下合适

返回主页