ai输出偶尔会蹦出外语台词的问题

0xy-avatar

0xy

2025-04-03T10:44:56+00:00

让ai扩写小说发现的

grok偶尔会蹦出几个英语单词
比如把“我肯定不会”写成“我indeed不会”
这都能理解,毕竟这是美国公司做的

但是同样美国公司的google gemini就很诡异了
它是偶尔在输出中文时,蹦出来俄语单词(不确定,反正是西里尔字母的的单词),这是最常见的,比较罕见的我还见过大段汉语里夹杂藏语和梵语(还是印地语?)的

这是什么毛病,我看哈基米的思考过程也是英语啊?汉化不完整不也该向grok那样出英语么
jakethederp-avatar

jakethederp

不明觉厉2.5pro多语言的情况已经很少了吧,换个预设看看,然后温度调低一点。我的温度喜欢在0.7-0.85
LaughingBallSack-avatar

LaughingBallSack

Gemini训练语料用了大量俄文韩文印地文等,尤其涩涩语料特别多,所以写涩涩时尤其容易遇到。然后就是它可能某步训练没做好,具体我也不懂,结果就是导致输出时时常乱蹦文字。

不过pro系列还好,较少遇到。flash thinking那才是重灾区。
fahmikaze-avatar

fahmikaze

确实我也遇到了,都是一两个看不懂的单词,不过还好谷歌翻译一下就行
уТЕНОК-avatar

уТЕНОК

grok也会蹦别的语言的,甚至grok弹警告都是八国语言随机来的
KVaX Zeo-avatar

KVaX Zeo

模型问题,习惯就好
gemini1.5动不动给你八国联军语言混在一起,根本遭不住
itsyourboyzion-_--avatar

itsyourboyzion-_-

LLM不知道什么是什么语言,它只是根据训练数据和采样器生成概率最高的token
>1.0的温度会让llm更多地选择不常见,低概率的token
如果频繁遇到拉低温度或者top-p