[求助][已解决]5800X偶发性超温如何排查?

Takeo-avatar

Takeo

2021-11-18T11:50:13+00:00

各位大神,我最近刚组了一台5800X的机器,未超频,默认主板配置,但是碰到一个问题,平时CPU温度都稳定在40度以内。但是会偶尔断电重启,并提示CPU over temperature error,进BIOS能看到CPU 100度左右。
特别诡异的是,等再次重启又回到40度以内了,并不知道下一次何时会复现。

能提供的信息有:
1. 硬件:CPU 5800X、主板:华硕(ASUS)TUF GAMING B550-PLUS、水冷:CoolerMaster冰神B360 ARGB
2. 并不频繁,无征兆,平均1.5天1次
3. AIDA64 烤机无法复现问题,CPU能压在74度以内。
4. PBO确实设置的是自动,但是关闭后也仍然会发生该问题

我真是没招了,求助各位大神排查思路?先谢谢了。
CHUNDA-avatar

CHUNDA

aida用的什么版本?最新6.50,最起码用6.33。

aida烤的哪一项是单独勾选了fpu吗?

bios用的哪个版本?

猜想3种情况,你单独勾选了 stress cpu,并不是最大发热情况,74度应该是对于stress cpu有点高的,那水冷可能没安装好,导致温度确实高。第二种情况,bios误判。第三,cpu确实有问题。以上请bios恢复全默认后尝试复现。
ftorens-avatar

ftorens

我5700g也是偶尔黑屏重启,然后启动界面显示cpu过热。再次启动就没事了。我用的360水冷,平时待机不超过40度,玩游戏也就5,60度,黑屏重启的时候cpu也没在重载,感觉这是个bug?
Takeo-avatar

Takeo

Reply to [pid=567546868,29521507,1]Reply[/pid] Post by [uid=43184202]一城南旧梦一[/uid] (2021-11-20 20:18)
回大佬的话,AIDA64是6.50.5800,bios也是最新的2423版本。

[img]https://img.nga.178.com/attachments/mon_202111/21/9aQqvdt-1ywvK1eT3cSu9-ef.jpg[/img]

烤机选项如下:
[img]https://img.nga.178.com/attachments/mon_202111/21/9aQqvix-a1q2ZhT3cSlf-gk.jpg[/img]

PS:就在刚才刚好又碰到这个问题了,CPU显示83度,还没触发重启,我赶紧用手摸了一下散热片,确实非常烫,这下是否能断定是水冷的问题了?

但诡异的就是,如果水冷有问题,他过一会(5分钟)后为啥又能降下来了,是否有故障解释原因?
`NiKiChan ♫💎-avatar

`NiKiChan ♫💎

CPU over temperature error这个错误很多时候和温度根本没关系,是SOC/核心电压不够
去事件查看器找有没有whea18/19吧
CHUNDA-avatar

CHUNDA

[quote][pid=567610944,29521507,1]Reply[/pid] Post by [uid=61798345]jigi330[/uid] (2021-11-21 03:04):

回大佬的话,AIDA64是6.50.5800,bios也是最新的2423版本。

[img]https://img.nga.178.com/attachments/mon_202111/21/9aQqvdt-1ywvK1eT3cSu9-ef.jpg[/img]

烤机选项如下:
[img]https://img.nga.178.com/attachments/mon_202111/21/9aQqvix-a1q2ZhT3cSlf-gk.jpg[/img]

PS:就在刚才刚好又碰到这个问题了,CPU显示83度,还没触发重启,我赶紧用手摸了一下散热片,确实非常烫,这下是否能断定是水冷的问题了?

但诡异的就是,如果水冷有问题[/quote]全勾不是最大热量的状态,只勾选fpu是最大发热,可以尝试。

第二,如果你都觉得烫手,那怀疑一下冷排的散热风扇是否正常工作? zen3能让冷排烫手不容易,那积热.. 当然冷排烫手能说明两件事,第一cpu的热量确实传递到散热器了,第二冷头的泵也在运转,并且把热量传递到冷排上了。问题是没排出去?(可能,但是我觉得冷排风扇要是不在正常运转应该很容易从外观上看到吧?)

然后说下下你是什么情况下会遇到你说的温度突然飙高,空载?还有机箱型号和冷排安装的位置,以及环境温度吧。

最后楼下老哥说的你也看看,时间查看器有没有什么报错,尤其注意看你说的“断电重启”时间点前后,有无whea error,ID为18/19的。
Jeverse-avatar

Jeverse

5800x积热的问题非常严重,这个属于硬件缺陷了
Takeo-avatar

Takeo

[quote][pid=567611351,29521507,1]Reply[/pid] Post by [uid=355910]macintosh[/uid] (2021-11-21 03:12):

CPU over temperature error这个错误很多时候和温度根本没关系,是SOC/核心电压不够
去事件查看器找有没有whea18/19吧[/quote]没呢,事件里就是:“The system has rebooted without cleanly shutting down first. “,

[img]https://img.nga.178.com/attachments/mon_202111/21/9aQmlar-j7ygZdT3cSs2-o1.jpg[/img]

刚才拆了外壳,又测试了几次,碰到了问题复现,CPU散热片热的确烫的无法触摸,根据回忆,可以推断的是:
在关机再重启后,或者是睡眠唤醒后的时候,此问题高概率发生,温度在60-70度之间徘徊,有可能伴随水泵喀喀喀的轻微一阵响,温度就降到27度, 如果没有喀喀喀声😂,接下来就是热保护的时间了。
目前怀疑水泵的问题最大。先拆了再装上看看,已经提交了换货。
第一次装水冷,居然是这个体验。好坑啊😂。
Takeo-avatar

Takeo

Reply to [pid=567612884,29521507,1]Reply[/pid] Post by [uid=63171500]甘雨的黑丝[/uid] (2021-11-21 03:44)

FPU测试下来,稳定在66度左右。
[img]https://img.nga.178.com/attachments/mon_202111/21/9aQmlav-dr5uZiT3cSoi-jb.jpg[/img]

机箱是金河田(Golden field)MUT1电脑机箱,一体式水冷风扇安装在机箱顶部,感觉应该是正常运转的(我也不太懂),这个呼呼的吹风,想忽略都难。

现在目测就是在开机或者睡眠唤醒后发生的概率最高,此时应该是空载的吧😂,之后如果能正常运行,就不会再超温了。如果温度持续飙高,就热保护重启,然后就又可能正常了🤣
oral-avatar

oral

大概率水冷出问题了,还是风冷保平安[s:ac:哭笑]
CHUNDA-avatar

CHUNDA

[quote][pid=567613982,29521507,1]Reply[/pid] Post by [uid=61798345]jigi330[/uid] (2021-11-21 04:18):

FPU测试下来,稳定在66度左右。
[img]https://img.nga.178.com/attachments/mon_202111/21/9aQmlav-dr5uZiT3cSoi-jb.jpg[/img]

机箱是金河田(Golden field)MUT1电脑机箱,一体式水冷风扇安装在机箱顶部,感觉应该是正常运转的(我也不太懂),这个呼呼的吹风,想忽略都难。

现在目测就是在开机或者睡眠唤醒后发生的概率最高,此时应该是空载的吧😂,之后如果能正常运行,就不会再超温了。如果温度持续飙高,就热保护重启,然后就又可能正常了🤣[/quote]那唤醒之后或者刚开机之后,过热之前,电脑操作会明显卡顿吗?如果可以趁着没过热之前,打开aida看下功耗(如果你这个试用版能看到,看不到就去找个激活码或者换hwinfo看看,同时打开任务管理器看下是谁在占用。

还是说你待机之后水冷那块没有恢复正常运行?那刚开机为什么也会?你的系统是哪里下载安装的? 快有点把我整不会了


ps:你能看到风扇及冷头的转速吗?
nanamei-avatar

nanamei

水冷坏了,有可能一断时间泵不转了。
Takeo-avatar

Takeo

Reply to [pid=567617470,29521507,1]Reply[/pid] Post by [uid=42376542]starboysm[/uid] (2021-11-21 06:47)
你说的对,就是这个原因。
已经把水泵电源插了 CPU_FAN、CPU_OPT、和AIO_PUMP都试过了,有概率碰到开机水泵转速NAN的情况,此时就是CPU开始升温到热保护。
特别是插到CPU_FAN上最明显,因为开机直接报“CPU FUN ERROR”了😂
今天早上把水冷拆了,已经寄出去换货了。水冷这玩意儿,可真是易装难拆啊,差点主板都拆了,累。