几款国内外AI大模型实力对比到底如何?

ekalb81-avatar

ekalb81

2025-04-14T09:28:00+00:00

国内四天王: deepseek 通义千问 豆包 kimi
国外四天王: chatgpt gemini grok3 claude
到底有没有差距?如果有,追赶速度如何?
書記長-avatar

書記長

因为DS的开源,和部分AI还处于免费使用拓展用户阶段,这个问题目前意义不大,都用着呗。

哦不对,grok有独有优势,不可替代()
txtcx-avatar

txtcx

claude打马里奥最强
写代码最强
GeoTheCar-avatar

GeoTheCar

目前体验最好的,是抖音出的豆包,可以生图,也可以和D指导一样聊天。也不弱智
华为的小艺虽然说部署了DS,但是比正版的D指导要弱智一些,而且限制词很多
Gamerpro-avatar

Gamerpro

ds,GPT,grok Gemini是第一梯队

Claude快掉队了
BouBoc-avatar

BouBoc

开源大于一切
slime-avatar

slime

论效果的话,现在最好的是Gemini,claude 以及疑似gpt的变形金刚alpha系列。

不过claude太贵,最近又总出幺蛾子,在下一代发布之前不建议用了。
Ansh.singhish-avatar

Ansh.singhish

我觉得是各自有擅长的地方,不能直接对比。整体从我使用的情况而言,感觉幻觉情况都挺严重,在实际工作上使用还是要留神。
个人觉得这几个模型写文章都还行,严谨性和逻辑性的话感觉GPT,deepseek和Claude好一些
bigboombird01-avatar

bigboombird01

现在更新太快了 隔几个月用起来区别就很大。
Ghostie<3-avatar

Ghostie<3

在我这Claude是top 无它 工作上太方便了
BlondeDutchess-avatar

BlondeDutchess

就我自己的使用来看,目前来说是google那个最强(最新的2.5版本),其次是ds稍弱。
然后chatgpt最新的那个画图,单独在这个领域独一档。
其他的我没用过。
Kenvin ツ-avatar

Kenvin ツ

虽然我是从一代就开始用的坚定ds党,但不得不说在某些场景一些看上去更笨的模型有优势。
譬如我测下来ds在长文本下指令跟随就没豆包好,他会比较固执地坚持用自己固有知识来回答。
ryn-avatar

ryn

Gemini 最好用,DeepSeek联网下搜索就是垃圾 被营销号骗的晕头转向
Nickwa-avatar

Nickwa

得看哪方面啊
ai能用的地方那么多呆
ananh-avatar

ananh

能搞黄色,直接吊打了好吧
Haruka765Pro-avatar

Haruka765Pro

某方面grok独一档 其他需求就用Gmi
KiWI-avatar

KiWI

kimi当搜索引擎用还行,我问它给我10个9以内相加等于67的数字,答了几遍都不对
豆包答错了但指出后就答对了
元宝用混元模型一次对
ds不开启深度思考也是一次对,而且给了一大堆不同的组合,但是它在那反复验算分析了好久哭笑

国外的chatgpt感觉审核比ds还过分
grok有别人没有的独一档功能,所以我把本地部署的模型都删了哭笑