[经验分享]关于AMD R7 5800X 无蓝屏直接重启 事件管理器记录WHEA18的排障提示

saibin-avatar

saibin

2021-04-04T10:05:00+00:00

如题所示,我一月份的时候入手了一块5800x+B550 Mortar Wifi 到手之后间歇性的出现无预兆黑屏重启问题。重新启动后事件管理器记录错误WHEA-18 三缓致命错误,
[quote]出现致命硬件错误。 由以下组件报告: 处理器核心 错误源: Machine Check Exception 错误类型: Cache Hierarchy Error 处理器 APIC ID: 14 该项的详细信息视图包含进一步的信息。[/quote]期间微软曾经建议我重装系统,然而并没有什么卵用,于是微软表示由于没有DMP内存转储用于故障分析,他们毫无办法
我曾经尝试打开/关闭PBO、刷最新的BIOS、降低频率更换散热器均无果
正当我以为我这颗体质有问题准备找售后扯皮的时候,我偶然间发现隔壁同样报WHEA-18,PCI-E总线报错的老哥提到,一部分CPU由于体质原因,在不跑满速度的时候,由于节能设置自动降压会导致部分核心欠压[tid]25625462[/tid]
回想到当时打开PBO时,主板经常将空载核心的电压降至1.025v左右,于是尝试将CPU核心电压提升至1.325V(根据CTR2.0的测试结果),核心频率固定在4650Mhz后再没出现过自动重启的现象
代价也是有的,我现在用的散热器是玄冰400,满载核心温度稳定82℃ 封装温度62℃ 这还是我在机箱上加了五把风扇的结果

希望给遇到故障不知道如何解决的老哥一点小小的帮助吧[s:ac:goodjob]
Moondog--avatar

Moondog-

简单说 18错误看id id是几就是几号线程电压没给够,用per core去提线程对应核心的电压就好,没必要整体加压,由于温度墙的限制会降低整体性能
Alice_-avatar

Alice_

主板BIOS全默认,也就是PBO关闭的情况下出WHEA18直接RMA,别挣扎,就是残次品。
开PBO,特别是调curve的时候出WHEA18一般就是核心电压减多了,比如楼主这个报错就是core 7报错,去curve把这个核心减的电压调小一些可解。
C9CRUNCH-avatar

C9CRUNCH

我刚拿到的时候 试过1.325@4.85ghz直接报whea18给我吓到了
saibin-avatar

saibin

Reply to [pid=506137831,26233597,1]Reply[/pid] Post by [uid=60131852]benzhou222[/uid] (2021-04-07 18:21)
[s:ac:哭笑]我这颗大雷 一月份到现在0~15号核心报错我都见过了 因为不是京东自营售后很可能要好久所以才自己折腾 能不换就不换了 我总不能一个月没事干在家钻木取火啊[s:ac:哭笑]
Not_lilpurp-avatar

Not_lilpurp

其实可以试试关闭节能选项C-state之类的,随机的出现这种一般是电压太低了降压再加上节能导致的瞬间电压太低,有些核心顶不住就黑了[s:ac:茶]
hex👻-avatar

hex👻

这种情况不是一定要锁全核的 摸一下核心体制 按核心单独设置negative即可 方法参考隔壁 [url]https://www.chiphell.com/thread-2309241-1-1.html[/url]
SevenSages-avatar

SevenSages

之前一打开DL轻负载玩游戏,玩两分钟就无蓝屏重启,然后报事件18,看了好多方法都不顶用,跟着楼主的设置下来解决了5800x无黑屏重启的问题,按照CTR2.1诊断后给出的电压和频率(1250mV&4600MHz)进BIOS锁了全核之后再也没出现过无蓝屏重启的情况,特地注册账号来感谢!![s:ac:赞同][s:ac:赞同][s:ac:赞同]
UnkleStilongs-avatar

UnkleStilongs

默认pbo报错18可以直接申请售后,都会换新的
halbrd-avatar

halbrd

我觉得你应该去换新的批次的cpu,这种肯定不正常
ᛈᚱᛁᛗᛖ 51210155 ᛈᚱᛁᛗᛖ-avatar

ᛈᚱᛁᛗᛖ 51210155 ᛈᚱᛁᛗᛖ

我一天内遇到过三次whea18,后来就没发生过了,应该申请换新吗?
nicekenny21-avatar

nicekenny21

APIC ID是线程吗,为什么我5900x 12c24t,报错的ID出现了0-27。。 按理应该是0-23啊