KxngDemon
2024-11-06T05:53:41+00:00
之前见过有的观点认为,DDR5 8000频率高、内存电压高,所以内存温度高、对内存散热条件要求高。
但事实上,AM5平台上的DDR5 8000,完全可以做到内存发热量和DDR5 6000几乎无区别。
内存发热量主要取决于两个因素,其一是实时内存带宽利用率,其二是内存电压。
而这两个因素,在AM5上的DDR5 8000和DDR5 6000可以做到区别很小。
先看其一,DDR5 8000的内存带宽利用率实际上和DDR5 6000差距很小。
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-eq5rZeT3cS1e7-ke.jpg[/img]
参考图片资料,Zen4和Zen5 MSDT的每CCD IF读取为32B/cycle,写入为16B/cycle。
对如9800X3D这种单CCD型号来说,当IF频率(FCLK)为2.0G时,
IF理论读取带宽为64GB/s,IF理论写入带宽为32GB/s。
IF理论读取刚好可以跑满相当于DDR4 4000的带宽;
IF理论写入刚好可以跑满相当于DDR4 2000的带宽。
(不过IF对内存写入数据有一定的压缩处理,因此实际内存写入可以跑出稍高于IF理论带宽的带宽利用)
因此,
当内存工作负载为满载纯读取时,内存带宽利用情况类似于DDR4 4000;
当内存工作负载为满载纯写入时,内存带宽利用情况类似于DDR4 2000;
当内存工作负载为满载2:1混合读写时,内存带宽利用情况类似于DDR5 6000;
当内存工作负载为非2:1比例的满载混合读写时,内存带宽利用情况介于DDR4 2000到DDR5 6000之间。
综上可知,IF限制了内存带宽的利用。
即使DDR5跑在8000,实际带宽利用也和DDR5 6000几乎无异。
那么带宽利用对内存发热量所造成的影响,DDR5 8000也就和DDR5 6000几乎无异。
再看其二,DDR5 8000并不一定需要很高的内存电压,使用1.35-1.45V的低内存电压一样可以跑8000。
下面将分享一套9800X3D+X870战斧导弹的DDR5低电压8000设置作业。
时序为
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-2eagKxT1kSh1-ng.png[/img]
这个时序可能难度偏高、对内存颗粒体质有一定要求,
所以这里也提供一个稍微放松的、更简单的时序设置参考(图中红字),也可用作超频调试的起点。
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-4mz9K11T1kSh1-ng.png[/img]
电压为
MEM VDD 1.40V
MEM VDDQ 1.40V
CPU VDDIO 1.40V
VSOC 0.95V
CLDO VDDP 1.00V
YC FFT烤鸡
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-a28hZuT3cS1ur-1bg.png[/img]
TM5 1US烤鸡
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-7dwpZoT3cS1ns-1bg.png[/img]
由于aida64的内存测试和AGESA 1.2.0.2a相性不合,这里不使用aida64来验证内存带宽与延迟效能,而使用更靠谱的Microbenchmark。
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-j5fmK12T3cSil-tq.png[/img]
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-fl4uK12T3cSi1-tb.png[/img]
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-995kKtT3cSif-rt.png[/img]
纯读取带宽63.1GB/s
纯写入带宽42.6GB/s
延迟61.4ns
9800X3D待机温度39度,待机功耗15瓦
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1d-9kbfKcT3cSjm-ag.png[/img]
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1d-jvfbKqT3cSjc-hu.png[/img]
总的来说,这套设置和[url]https://bbs.nga.cn/read.php?tid=40615809[/url]大部分都是一样的。
主要区别只是把内存电压从1.52V降低到1.40V,对应时序中的tCL和部分第三时序(tRDRDSCL, tWRWRSCL, tRDWR)稍微放松。
理论上这些时序调整所导致的具体性能影响为延迟增加约0.5ns,带宽稍微降低(幅度为0.1%量级)。
但事实上,AM5平台上的DDR5 8000,完全可以做到内存发热量和DDR5 6000几乎无区别。
内存发热量主要取决于两个因素,其一是实时内存带宽利用率,其二是内存电压。
而这两个因素,在AM5上的DDR5 8000和DDR5 6000可以做到区别很小。
先看其一,DDR5 8000的内存带宽利用率实际上和DDR5 6000差距很小。
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-eq5rZeT3cS1e7-ke.jpg[/img]
参考图片资料,Zen4和Zen5 MSDT的每CCD IF读取为32B/cycle,写入为16B/cycle。
对如9800X3D这种单CCD型号来说,当IF频率(FCLK)为2.0G时,
IF理论读取带宽为64GB/s,IF理论写入带宽为32GB/s。
IF理论读取刚好可以跑满相当于DDR4 4000的带宽;
IF理论写入刚好可以跑满相当于DDR4 2000的带宽。
(不过IF对内存写入数据有一定的压缩处理,因此实际内存写入可以跑出稍高于IF理论带宽的带宽利用)
因此,
当内存工作负载为满载纯读取时,内存带宽利用情况类似于DDR4 4000;
当内存工作负载为满载纯写入时,内存带宽利用情况类似于DDR4 2000;
当内存工作负载为满载2:1混合读写时,内存带宽利用情况类似于DDR5 6000;
当内存工作负载为非2:1比例的满载混合读写时,内存带宽利用情况介于DDR4 2000到DDR5 6000之间。
综上可知,IF限制了内存带宽的利用。
即使DDR5跑在8000,实际带宽利用也和DDR5 6000几乎无异。
那么带宽利用对内存发热量所造成的影响,DDR5 8000也就和DDR5 6000几乎无异。
再看其二,DDR5 8000并不一定需要很高的内存电压,使用1.35-1.45V的低内存电压一样可以跑8000。
下面将分享一套9800X3D+X870战斧导弹的DDR5低电压8000设置作业。
时序为
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-2eagKxT1kSh1-ng.png[/img]
这个时序可能难度偏高、对内存颗粒体质有一定要求,
所以这里也提供一个稍微放松的、更简单的时序设置参考(图中红字),也可用作超频调试的起点。
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-4mz9K11T1kSh1-ng.png[/img]
电压为
MEM VDD 1.40V
MEM VDDQ 1.40V
CPU VDDIO 1.40V
VSOC 0.95V
CLDO VDDP 1.00V
YC FFT烤鸡
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-a28hZuT3cS1ur-1bg.png[/img]
TM5 1US烤鸡
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-7dwpZoT3cS1ns-1bg.png[/img]
由于aida64的内存测试和AGESA 1.2.0.2a相性不合,这里不使用aida64来验证内存带宽与延迟效能,而使用更靠谱的Microbenchmark。
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-j5fmK12T3cSil-tq.png[/img]
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-fl4uK12T3cSi1-tb.png[/img]
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1c-995kKtT3cSif-rt.png[/img]
纯读取带宽63.1GB/s
纯写入带宽42.6GB/s
延迟61.4ns
9800X3D待机温度39度,待机功耗15瓦
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1d-9kbfKcT3cSjm-ag.png[/img]
[img]https://img.nga.178.com/attachments/mon_202411/14/9aQty1d-jvfbKqT3cSjc-hu.png[/img]
总的来说,这套设置和[url]https://bbs.nga.cn/read.php?tid=40615809[/url]大部分都是一样的。
主要区别只是把内存电压从1.52V降低到1.40V,对应时序中的tCL和部分第三时序(tRDRDSCL, tWRWRSCL, tRDWR)稍微放松。
理论上这些时序调整所导致的具体性能影响为延迟增加约0.5ns,带宽稍微降低(幅度为0.1%量级)。