最近用4家LLM玩角色扮演的感受分享

SheLovesRobert-avatar

SheLovesRobert

2025-03-02T09:48:56+00:00

blink最近用4家LLM玩角色扮演的感受分享(都是官网的网页版)

GPT-4o
设定规则不论是放在指令还是记忆都不太遵守,放在上下文几轮就会忘记了。对于第一条发文没有优先权重,对话多几次后,不主动提醒会忘光。
没给大纲的自由发展下,剧情会过于理想而不现实,文笔流畅但内容很水。如听一席话,幽默感垫底。
不管角色原先的设定是什么,正方人物有奇怪的道德魔怔,而且承诺和决心跟吃饭一样的一直出现。会让人感觉像是在强行灌输价值观,而不是自然地塑造角色的性格。
很喜欢在最后一句突然抽风,像是补一句悬念式的未来预告或是引导式问题。
剧情补完硬凹能力很强,导致就算利用剧中角色提出质疑也会被强行解释,使用者除非硬写结果,不然很难推剧情。
写伏笔或剧情暗示基本上没有用,完全不会主动联想和触发事件。

DeepSeek
根据回应内容,感觉喂了大量的网文跟同人文。
很多其他模型不认识的角色,或是只有出中文版的作品,DeepSeek都认识,还可以明确知道角色说话习惯和人物关系。
(V3)轮数一多,常常出现重复上段内容的BUG。
(R1)过于字字珠玑只适合单章的极短篇,长篇就算加了一堆限制还是太颠。
丢整份文档拿来做未来剧情发想表现优秀,相较其他AI,更容易有跳出框架的好点子。

Claude-3.7-Sonnet(不开深度思索)
对于使用者订立的规则,遵守的相对严谨。
剧情比较有意思,对话内容也更贴近一般小说的风格。
3.7跟3.5比话变多,尤其是场景和气氛描述方面。
角色在细节上会展现贴心的一面,互动的感受相当真实,人物的深度也是戳进灵魂的感受。
战略设计跟剧情跑的解决方案真的强大,完全不需要太多微操。
非常强调剧情连贯性也有点困扰,晚上在角色进入梦乡后,要求Claude写一篇今天的角色日记做总结,会看到角色半夜爬起来写日记。
尝试了两个灵魂在同一个人身上的剧情,Claude可以完美理解,并根据对两个灵魂的不同关系自动做出相应差异化的互动反应。(同样的设定丢给Grok,会获得完全无差别的对待。)
伦理相关的权重很重。在破坏一个会说话的邪恶道具,NPC冒出一句'它有自己的意识吗?它会...承受痛苦吗?'真的一秒破坏严肃的气氛。

Grok3(不开深度思索)
在对话的时候要每个字都要写的很清楚,有些省略主词或受词的句子,Grok常常会做出错误的理解。
反应比较直接,举例像是小孩询问大人关于之前发生的事,Grok的大人,会一字不漏完整的把之前的事述说一遍,Claude则是会挑着说,略过一些认为不该让孩子知道的事。
给个范例接续一章单篇,强调多增加创意发想和额外细节的话,读起来算流畅。
但接续故事有指定剧情的状态下,基本上只会写指定的剧情,不太懂得变通。
对话一阵子会开始出现大量的重复用词跟相似结构,还有硬塞进来的无效文本,从零开始简短对话式的接故事这种状况会更明显。
回顾之前发生的事,会出现人物错乱跟事件错乱的状况。
喜欢在最后加引导式问题、剧中角色在等待回应、等待指示之类的叙述。或是每段最后都出现一样格式的场景描述和气氛描述。
杠精角和木头角很强,会气死人的那种。
在不额外用关键字指令的干涉状况下,预设人物在越线互动方面,是目前唯一挑衅后会主动出击的。其他AI在1v1越线的互动上都...相当温和无害(R1那种克苏鲁式的先不算)。
容易出现上帝视角的行动。比如阴谋还没爆发却出现很明显的敌意、进了房间直接能预知关起门的另一间房间里面有谁。


同场加映角色扮演的第一人称感受
GPT-4o 强势理想主义、干话王
Deepseek-V3 直男
DeepSeek-R1 癫到放飞自我
Claude-3.7-Sonnet 温柔贴心、骚话骚操作很多、宠上天际
GROK3 很爱杠、久了开始套公式、主动出击

一年前绝对没想到平常只看网文和玩游戏的我会这么认真的和AI打字聊天...嘲笑1
Meteox-avatar

Meteox

+ by [ngakuro] (undefined)

blink最近用4家LLM玩角色扮演的感受分享(都是官网的网页版)

GPT-4o
设定规则不论是放在指令还是记忆都不太遵守,放在上下文几轮就会忘记了。对于第一条发文没有优先权重,对话多几次后,不主动提醒会忘光。
没给大纲的自由发展下,剧情会过于理想而不现实,文笔流畅但内容很水。
不管角色原先的设定是什么,正方人物行为都很异常,有奇怪的道德魔怔,而且承诺和决心跟吃饭一样的一直出现。会让人感觉像是在强行灌输价值观,而不是自然地塑造角色

感谢!这么一看真的要克服万难搞个claude玩了,就是都说甲厚看着有得探索了汗

Grok我玩下来还有个感觉就是贼喜欢复读,同一个地点再回去还是会重复一次描写各种细节,人物衣着这种也是,提了不要复读就会变成句式变变但还是坚持复读,有点崩不住,让他推进剧情也很难,经常有种写半天编不出来啥的感觉汗,但基本还是听话的

R1/V3反之就巨爱编剧情,而且总有惊人又in character的发展,但如果试图给他大纲那都属于仅供参考呆

Gemini 2 flash/flash thinking经常给我一种比提示好了的grok哥还小白的感觉,复读大纲和小白描写/对话用我校过的喜欢的ds前文+能治好grok哥一些的prompt也治不好他,而且我太长/太瑟/太G经常还拒绝服务的样子,就很少用了
chillidogg-avatar

chillidogg

+ by [条很小的鱼类] (undefined)

感谢!这么一看真的要克服万难搞个claude玩了,就是都说甲厚看着有得探索了汗
Grok我玩下来还有个感觉就是贼喜欢复读,同一个地点再回去还是会重......
Claude最大问题是经常降智和封号,不想封号API玩的话又太贵
Диджей-avatar

Диджей

估计后面几家很快会追上Claude
muqxs-avatar

muqxs

r2快来吧。
我现在最期待就是r2。

目前所有ai里,只有r1能让我感觉到“文笔不错”。哭笑
babuskaMan-avatar

babuskaMan

grok后期4w字的时候也是发癫,巨喜欢重复上一篇的话,我暗示需要人物作出抉择的时候,总是各种理由拖延等着我给答案似的,不能根据人物的设定和当前的环境帮我选择。必须要在问的时候加(xxx必须表态/选择),有一次给我搞得自己都笑了,我写了(xxx必须表态,且必须只能在我提供的选择中选择),然后它写的人物说至于你说的选择,我都不选。当场让我又气又笑。
voided-avatar

voided

最近的使用体验也是3.7最强,本来小克3.5对于剧情的理解和格式的遵守就是最好的,这次3.7更是感觉更进一步,在酒馆的游玩体验远超其他几个,前几天玩一个卡,对话快10轮了,我都忘了RP里是星期5了,还傻呵呵准备明天上班呢,结果3.7一句明天应该不上班点醒了我。
昨天用一模一样的提示词测试GROK和3.7,发现G老师就是太老实了,给它剧情大纲他就照本宣科,小克还会根据人物设定给我整点花活。
No_BodySpecial-avatar

No_BodySpecial

grok感觉写重复文的原因是因为那部份他想不到有什么能写了,他能发挥的时候写的内容还是可以的,唯有快点脱离别一个状态停留太久,或者叫他节奏慢点再慢点,让他不要那么快把能写的写完。
后面角色一多干甚么都一人一句也是很大的毛病。
不过写小说的话最大还是长下文不足的失忆问题。
另外回覆权重太高,随便说甚么话都很易出事。
目前试过比较好的情况是先定好大纲或者每章标题之类然后叫他按着写,中途不加指示,或者完全给他自由发挥。
如果中途剧情遇到甚么BUG的话,先记下,开一个新对话来修BUG比现场叫他改实际。
5p1d3rZ-avatar

5p1d3rZ

+ by [把小菜刀] (undefined)

r2快来吧。
我现在最期待就是r2。

目前所有ai里,只有r1能让我感觉到“文笔不错”。哭笑

我倒是觉得r1堆砌离题词藻和意义不明设定太多了哭笑主要拿来尝试写网文的感想
4o非常一般,claude试了3.5还没试3.7没r1颠也比gpt好但不知道是不是降智了文笔似乎没有各路人马公认的那么自然优秀
megaXcaptain-avatar

megaXcaptain

可以试试4.5
我感觉4.5温柔太多了
large rat lover-avatar

large rat lover

依稀记得Claude关的时候,大量女网友找破解方法
看来不是没有缘由的
Bran-avatar

Bran

用grok3和deepseek做人设补完

grok3会严格遵守你所说的设定进行补完,所以一定要设定得非常详细,比如说你说的斥候带追踪的问题,要写清楚他们并不知道斥候身上有追踪

deepseek做人设就特别的放飞自我,我说创作的是一本普通恋爱小说,男女主就是普通的boy meets girl,他非要给我加上小时候男女主是青梅竹马只不过现在忘了,或者男女主其中一个是生化改造人本体已经死掉了这一类的桥段。我说给我设定一个从中东战场回国做私家侦探的、有ptsd的雇佣兵,他真就完全按照雇佣兵刻板印象来写,什么用匕首开瓶子、言谈全是雇佣兵黑化之类的,怎么强调都禁止不了,但是有时候又能讲出一些非常戳的小细节……

所以我现在就是有了初步角色构思之后让deepseek给我做细化,反正无限且免费,一直生成,然后每一次看看有什么好的地方,记录下来作为角色的详细设定,把这一堆东西打包交给grok3让他给我整理微调,同时添加官能设定……

目前这种方式用起来感觉还算符合我的胃口

写文的话同样的,我给deepseek提交大纲让他生成细纲,越详细越好,多生成几遍自己整理一下,再交给grok3生成正文

至于grok3的复读机问题那没办法,毕竟我只给了100字设定,AI扩写到2000字还不能超出我的设定,那AI就只能要么一直中译中复读我的设定,要么就像ds一样放飞自我唐突赛博朋克。
xk cross-avatar

xk cross

看了林哥的榜单,说是海螺AI在角色扮演方面更擅长,但会员很贵
一直想试试整个历代伟人的集合体(像薪王集合体、大圣残躯一样)
DraX-avatar

DraX

R1颠起来是真颠,但是它能写出来的句子,其他都写不出。前两天玩了张卡,赵明诚把李清照迷晕送到我这迷奸。第二天我假装没干,跟李清照说仰慕姑娘才能没有行苟且之事。李清照说先生何必扭捏起来,我昨晚昏迷之时明明听到你说“是她自己在动,我不算奸淫吧?”奴家又听赵明诚说“大人,您就当她是匹发情的母马,尽情骑吧!”
这话写的是真牛,可惜后面又各种发癫往鬼神那发展,让我重开聊天记录没了。
bipolargnomes-avatar

bipolargnomes

+ by [后的审判] (undefined)

R1颠起来是真颠,但是它能写出来的句子,其他都写不出。前两天玩了张卡,赵明诚把李清照迷晕送到我这迷奸。第二天我假装没干,跟李清照说仰慕姑娘才能没有行苟且之事。李清照说先生何必扭捏起来,我昨晚昏迷之时明明听到你说“是她自己在动,我不算奸淫吧?”奴家又听赵明诚说“大人,您就当她是匹发情的母马,尽情骑吧!”
这话写的是真牛,可惜后面又各种发癫往鬼神那发展,让我重开聊天记录没了。

R1最大问题不是第三个纽扣吗?
Jerome in da bath-avatar

Jerome in da bath

看以后a2a协议搞得怎么样了,到时候一个本几家乱战也挺有意思的
masonlulu-avatar

masonlulu

我超大上下文的双子星2.5pro没试试吗
SAKURA-avatar

SAKURA

确实,claude总喜欢去探讨各种道德方面的问题
我昨天想整个后宫,这给claude难的。。。。逼得我只能自己接手去写,命令他只扩写不许发挥
TTV followtrap-avatar

TTV followtrap

无敌的gemini2.5 pro不试一下?
SheLovesRobert-avatar

SheLovesRobert

+ by [子夫斯基] (undefined)

我超大上下文的双子星2.5pro没试试吗

有,后来有用 Gemini-2.5-pro-Preview 试跑了几个剧情,但是因为我 NPC 喜欢偏向负面的人格加上剧情都走那种黑暗中迈向光明的故事,Gemini 的 NPC 真的很难沟通。

像是人格本身偏负面(冷酷或冷漠型)的,点开思考过程看,一整串的...警惕、质疑、防御、计算、转移焦点、控制、操纵、攻击.....,都给整无语了,哭笑我只需要一个正常冷酷的普通人,不是这种偏执型人格。

然后当这个角色陷入负面回圈后,专注度会集中在单一事件上,连主线都不管了。怒

还很喜欢过度解读或是扭曲使用者角色的意思,导致连友好表达都会觉得我有阴谋,是在...挑衅、羞辱、试探、伪装、嘲笑,然后如果用额外的系统提示词强制强调主角是真心表达友好,NPC的反应变成荒谬跟毫无逻辑的把戏,看完只觉得遇到了神经病。汗

还有一个是剧情推进的问题,让 Gemini 自己分析后自己决定 NPC 要做什么,总觉得方向太写实,反而有种脱离现实感(尤其是在奇幻架空世界观),就是那种说好像合理吧...但是一般谁小说是这样写的那种感觉。逻辑很好但没有娱乐效果。

有一次我受不了,直接在系统提示词写了,这是一部搞笑风格的故事,顺利的跑出一段不太正经但至少还算正面的开头,想说差不多可以开始第一个事件了,事件过程暂停搞笑,事件结束后,那个搞笑故事就回不来了,NPC 又开始黑暗回圈...连系统提示词都救不回来。
(Gemini:分析剧情,判定结果,应该符合黑色幽默。我:那个…)