SheLovesRobert
2025-03-02T09:48:56+00:00

GPT-4o
设定规则不论是放在指令还是记忆都不太遵守,放在上下文几轮就会忘记了。对于第一条发文没有优先权重,对话多几次后,不主动提醒会忘光。
没给大纲的自由发展下,剧情会过于理想而不现实,文笔流畅但内容很水。如听一席话,幽默感垫底。
不管角色原先的设定是什么,正方人物有奇怪的道德魔怔,而且承诺和决心跟吃饭一样的一直出现。会让人感觉像是在强行灌输价值观,而不是自然地塑造角色的性格。
很喜欢在最后一句突然抽风,像是补一句悬念式的未来预告或是引导式问题。
剧情补完硬凹能力很强,导致就算利用剧中角色提出质疑也会被强行解释,使用者除非硬写结果,不然很难推剧情。
写伏笔或剧情暗示基本上没有用,完全不会主动联想和触发事件。
DeepSeek
根据回应内容,感觉喂了大量的网文跟同人文。
很多其他模型不认识的角色,或是只有出中文版的作品,DeepSeek都认识,还可以明确知道角色说话习惯和人物关系。
(V3)轮数一多,常常出现重复上段内容的BUG。
(R1)过于字字珠玑只适合单章的极短篇,长篇就算加了一堆限制还是太颠。
丢整份文档拿来做未来剧情发想表现优秀,相较其他AI,更容易有跳出框架的好点子。
Claude-3.7-Sonnet(不开深度思索)
对于使用者订立的规则,遵守的相对严谨。
剧情比较有意思,对话内容也更贴近一般小说的风格。
3.7跟3.5比话变多,尤其是场景和气氛描述方面。
角色在细节上会展现贴心的一面,互动的感受相当真实,人物的深度也是戳进灵魂的感受。
战略设计跟剧情跑的解决方案真的强大,完全不需要太多微操。
非常强调剧情连贯性也有点困扰,晚上在角色进入梦乡后,要求Claude写一篇今天的角色日记做总结,会看到角色半夜爬起来写日记。
尝试了两个灵魂在同一个人身上的剧情,Claude可以完美理解,并根据对两个灵魂的不同关系自动做出相应差异化的互动反应。(同样的设定丢给Grok,会获得完全无差别的对待。)
伦理相关的权重很重。在破坏一个会说话的邪恶道具,NPC冒出一句'它有自己的意识吗?它会...承受痛苦吗?'真的一秒破坏严肃的气氛。
Grok3(不开深度思索)
在对话的时候要每个字都要写的很清楚,有些省略主词或受词的句子,Grok常常会做出错误的理解。
反应比较直接,举例像是小孩询问大人关于之前发生的事,Grok的大人,会一字不漏完整的把之前的事述说一遍,Claude则是会挑着说,略过一些认为不该让孩子知道的事。
给个范例接续一章单篇,强调多增加创意发想和额外细节的话,读起来算流畅。
但接续故事有指定剧情的状态下,基本上只会写指定的剧情,不太懂得变通。
对话一阵子会开始出现大量的重复用词跟相似结构,还有硬塞进来的无效文本,从零开始简短对话式的接故事这种状况会更明显。
回顾之前发生的事,会出现人物错乱跟事件错乱的状况。
喜欢在最后加引导式问题、剧中角色在等待回应、等待指示之类的叙述。或是每段最后都出现一样格式的场景描述和气氛描述。
杠精角和木头角很强,会气死人的那种。
在不额外用关键字指令的干涉状况下,预设人物在越线互动方面,是目前唯一挑衅后会主动出击的。其他AI在1v1越线的互动上都...相当温和无害(R1那种克苏鲁式的先不算)。
容易出现上帝视角的行动。比如阴谋还没爆发却出现很明显的敌意、进了房间直接能预知关起门的另一间房间里面有谁。
同场加映角色扮演的第一人称感受
GPT-4o 强势理想主义、干话王
Deepseek-V3 直男
DeepSeek-R1 癫到放飞自我
Claude-3.7-Sonnet 温柔贴心、骚话骚操作很多、宠上天际
GROK3 很爱杠、久了开始套公式、主动出击
一年前绝对没想到平常只看网文和玩游戏的我会这么认真的和AI打字聊天...
