N8 Wrld🥶
2024-11-18T02:34:55+00:00
老黄牙膏再次挤爆??[s:ac:呆][s:ac:呆]
[img]https://img.nga.178.com/attachments/mon_202411/20/9aQ19v-iw9vZmT3cSu0-tn.jpg.medium.jpg[/img]
[quote][pid=795785521,42503457,1]Reply[/pid] Post by [uid=60222695]不要松解啊[/uid] (2024-11-20 10:42):
强一倍吗,那到国内不得卖3w?[/quote]?国内禁售[s:ac:喘]
18GB显存的5070啥时候出,我就差这2GB显存,就可以爽玩在线漫画翻译了
现在出来的参数能信一信,性能都瞎jb乱猜,爆料者者又不是老黄本人
Reply to [pid=795787240,42503457,1]Reply[/pid] Post by [uid=6561783]zmw0510[/uid] (2024-11-20 10:50)
老哥怎么玩的?
Reply to [pid=795787240,42503457,1]Reply[/pid] Post by [uid=6561783]zmw0510[/uid] (2024-11-20 10:50)
翻译模型换个int4量化的试试?
Reply to [pid=795787240,42503457,1]Reply[/pid] Post by [uid=6561783]zmw0510[/uid] (2024-11-20 10:50)有啥教程不,我也想玩一下。
这性能指标要是真的,暴打4090啊,这显存带宽离了大谱了
[quote][pid=795788590,42503457,1]Reply[/pid] Post by [uid=62551202]OrgoDemir[/uid] (2024-11-20 10:55):
有啥教程不,我也想玩一下。[/quote][url]https://ngabbs.com/read.php?tid=41765757[/url]
16GB显存起
[quote][pid=795788565,42503457,1]Reply[/pid] Post by [uid=34435454]silicon14[/uid] (2024-11-20 10:55):
翻译模型换个int4量化的试试?[/quote]相关内容发楼上了,不用上采样放大,显存勉强够。用上采样就开始用1.xGB的内存做共享显存,会慢一点。
[quote][pid=795788071,42503457,1]Reply[/pid] Post by [uid=7889365]yuuichi[/uid] (2024-11-20 10:53):
现在出来的参数能信一信,性能都瞎jb乱猜,爆料者者又不是老黄本人[/quote]这个论坛很多ID已经明确下结论50系性能提升不大了。
你是怎么看出5080超4090的?你发的这个图里面5080明显不如4090啊
还不如看看能不能解禁个4090和5080,卡死5090
否则老黄以后还怎么卖卡
Reply to [pid=795807154,42503457,1]Reply[/pid] Post by [uid=6561783]zmw0510[/uid] (2024-11-20 12:16)
就帖子里给的这个链接,hf里就有个q3量化的,正好能把你这点显存省出来
另外git上sakurallm有一个基于qwen2.5-1.5b的模型,这个小很多,对于这类较为简单的任务效果应该还可以
[url]https://huggingface.co/SakuraLLM/Sakura-14B-Qwen2.5-v1.0-GGUF[/url]
5080=110% 4090
5090=150% 4090
5090首发必买,5080什么臭鱼烂虾[s:ac:茶]