几款国内外AI大模型实力对比到底如何？

ekalb81

2025-04-14T09:28:00+00:00

国内四天王: deepseek 通义千问豆包 kimi
国外四天王: chatgpt gemini grok3 claude
到底有没有差距？如果有，追赶速度如何？

書記長

因为DS的开源，和部分AI还处于免费使用拓展用户阶段，这个问题目前意义不大，都用着呗。

哦不对，grok有独有优势，不可替代()

txtcx

claude打马里奥最强
写代码最强

GeoTheCar

目前体验最好的，是抖音出的豆包，可以生图，也可以和D指导一样聊天。也不弱智
华为的小艺虽然说部署了DS，但是比正版的D指导要弱智一些，而且限制词很多

Gamerpro

ds，GPT，grok Gemini是第一梯队

Claude快掉队了

BouBoc

开源大于一切

slime

论效果的话，现在最好的是Gemini，claude 以及疑似gpt的变形金刚alpha系列。

不过claude太贵，最近又总出幺蛾子，在下一代发布之前不建议用了。

Ansh.singhish

我觉得是各自有擅长的地方，不能直接对比。整体从我使用的情况而言，感觉幻觉情况都挺严重，在实际工作上使用还是要留神。
个人觉得这几个模型写文章都还行，严谨性和逻辑性的话感觉GPT，deepseek和Claude好一些

bigboombird01

现在更新太快了隔几个月用起来区别就很大。

Ghostie<3

在我这Claude是top 无它工作上太方便了

BlondeDutchess

就我自己的使用来看，目前来说是google那个最强(最新的2.5版本)，其次是ds稍弱。
然后chatgpt最新的那个画图，单独在这个领域独一档。
其他的我没用过。

Kenvin ツ

虽然我是从一代就开始用的坚定ds党，但不得不说在某些场景一些看上去更笨的模型有优势。
譬如我测下来ds在长文本下指令跟随就没豆包好，他会比较固执地坚持用自己固有知识来回答。

ryn

Gemini 最好用，DeepSeek联网下搜索就是垃圾被营销号骗的晕头转向

Nickwa

得看哪方面啊
ai能用的地方那么多

ananh

能搞黄色，直接吊打了好吧

Haruka765Pro

某方面grok独一档其他需求就用Gmi

KiWI

kimi当搜索引擎用还行，我问它给我10个9以内相加等于67的数字，答了几遍都不对
豆包答错了但指出后就答对了
元宝用混元模型一次对
ds不开启深度思考也是一次对，而且给了一大堆不同的组合，但是它在那反复验算分析了好久

国外的chatgpt感觉审核比ds还过分
grok有别人没有的独一档功能，所以我把本地部署的模型都删了