けーさん
2025-04-28T06:09:43+00:00
前排省流
不同家显存的的T j直接对比并无太大的意义,关键在于结合功耗等因素进行分析。只要离设备设计的温度上限有足够的余量,并且没有表现出其他异常,那么该怎么用怎么用就是。9070系vbios内置的温度目标里,对显存结温的目标温度普遍都比核心温度高,一般高10度左右,而xfx好像设定的会低一些,大概高4度。因此对目前海力士显存而言,满载烤机时,如果显存温度比核心热点高10℃左右,而热点和平均温差在25℃左右则完全正常,不用焦虑显存散热。如果高到20摄氏度甚至更高,那就是明摆着有导热垫接触不良/散热器公差等问题,可以通过返厂换导热垫/散热器,或是自己换改善。
改:泥潭这上下标太不明显了索性直接去掉下标[s:ac:哭笑]
结温?封装温度?哪个温度才是正确温度?
在电子元器件的热参数信息中,经常会出现数个温度。其中,结温(Tjunction/Tj)即是硅片内置温度传感器测得的温度,一般也是实际最热的温度。但是结温的高低十分受制于温度传感器设置的位置,所以是一个器件特定的值。另一个经常出现的温度是封装表面温度(Tcase/Tc)。顾名思义,这个温度是于封装表面测得的温度。器件的工作温度指标通常使用Tc来记载,或者使用下方所述的Ta,在数据手册里也会注明用哪个温度,比如下方的镁光就注明工作温度0-95度是Tc。类似的还有底下的PCB温度Tboard/Tb,毕竟通过PCB上的铺铜散热也是常见的一种。
环境温度Tambient/Ta 在小器件经常出现。毕竟小半导体器件通常不加散热片,引入环境温度这个指标能更好的表现实际环境下的自然散热能力,很多手册也会给出器件工作时的环境温度要求,但显存必然是加着散热片用的,所以这个参数的意义反而没那么大。
具体的图示可见下图。既然有传热那么就必然有热阻,几个对应的传热热阻也显示在图中。对显存而言,一般θjc也就是从die到封装温度最小, θjb也就是从die到安装的电路板的热阻次小,所以很多背板部位也会加导热垫,至于到环境的热阻那就大了,而且该热阻通常对被动散热的器件意义比较大。
[img]https://img.nga.178.com/attachments/mon_202505/01/9aQ696t-5ukzK1oT3cSsg-di.jpg[/img]
三星温度低?软件显示真的是正确的么?
和前代产品相比,GDDR6还有后续的显存颗粒的一大特点便是引入了强制要求的温度传感器,对结温Tjunction进行测量。除了报送给控制器用于温控避免过热,温度数据还可以令控制器得以根据温度自动调整时序,以获得最佳性能。然而,该温度传感器的精度取决于厂商。 JEDEC规范只要求GDDR6有上报温度的选项,但具体将温度传感器设计在哪里,是测量最热部分的温度,还是设计在平均一些的地方测量更平均的温度,则完全取决于厂商。但不管厂商放哪儿,这个测温传感器的数据必然符合数据手册里对热参数的相关要求。懒得看典型的图示的话就不用点开下边那图了,毕竟也是照搬手册(
点击展开 ...
[img]https://img.nga.178.com/attachments/mon_202505/01/9aQkk2-ffo9ZrT3cSu9-t6.jpg[/img]
就算是三星的手册,该段内容大概也是直接复制JEDEC里的图示吧,表格的序号都打错了[s:ac:哭笑]
就算是三星的手册,该段内容大概也是直接复制JEDEC里的图示吧,表格的序号都打错了[s:ac:哭笑]
然而在用热电偶直接测量显存封装表面温度(实际上是在自制散热器上把探头塞到铜制散热器里。但是补偿了测温的温度误差,而且选了最热的部位),用热成像观察PCB背板温度并和HWInfo汇报的显存结温Tj对比后发现,烤机到温度稳定时该颗粒结温和封装温度有着15摄氏度的温差。在传感器内读取的显存结温是84℃时,传感器测得显存表面为69℃,而PCB背板热成像大概65℃。对9070xt的海力士显存,贴吧有人使用热电偶测试了表面温度,发现烤机时实际表面温度和软件显示温差大概为24摄氏度左右,见 [url]https://tieba.baidu.com/p/9679282939[/url] 虽然是跨品牌跨代对比,但也有着类似的趋势。
不管是三星还是美光,8Gb颗粒的GDDR6数据手册都相当好找。三星的 K4Z80325BC是和D9WCW同代的颗粒,也在5700XT上有采用。可以在手册里看到封装到表面热阻仅为1.7℃/W,按一颗显存功耗3W计算,温差此时也仅仅只有5℃。这个热阻和从半导体结到PCB板的热阻5.1℃/W和封装相比大了3倍多,但总归还算比较小,所以背板加导热垫还是有他的道理所在。
然而在表面封装温度Tc限值上,三星手册指出Tc最高85摄氏度,Tj最高86.1℃,表面温度和传感器上报的结温温差极低,也不符合半导体厂商一贯给结温定到100度左右的惯例,不好说是不是测温传感器避开了热点放置,从而上报温度基本就是Tcase的情况。镁光G6手册仅给出一个Tc最高为95℃,实际结温的限值必然更高。老黄的初代G6X主动降频温度是104度,和消费级G6X的95度Tcase比高了10度左右,5700XT的显存温度上限也是105度,一定程度也能说明镁光的实际结温温差大概在10度左右。因此在实际产品这种只能测到结温的应用里对不同家的产品脱离数据表直接对比,甚至拿结温直接比较Tcase的行为明显没意义。
但是,上述的三星和镁光同代显存的差异性还可以通过别的地方体现。两者都是矿潮期间大量使用的颗粒,三星显存在GPU电压调节器端测得的显存功耗实际上比镁光颗粒更小,超频性能也更好,尤其是搭上30系电老虎后笔记本上分配给核心的功耗往往可以比镁光颗粒更多,带来更好的性能表现,才是三星那代颗粒更好的实证。
然而在这代高频颗粒上,尤其是7900系上的三星颗粒表现则可以说一塌糊涂,虽然软件显示温度同样低,但是体质普遍没有同期海力士产品好。泥潭有人9070烤机实测也表明三星显存和海力士显存烤机时的显存功耗并无显著差异,1.35V轨道供电均在30W左右。因此三星温度低大概只是人在温度传感器位置上玩的一点小把戏罢了,和砍掉热点这一样[s:ac:哭笑]
上边提到的三星和镁光两款显存颗粒对应的手册页面见下图(
点击展开 ...
不过就算是厂家数据手册有时候数据有问题也很正常,所以经常见到数据手册会修订就是
[img]https://img.nga.178.com/attachments/mon_202505/01/9aQv4le-jfueZeT3cSsg-il.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202505/01/9aQv4le-6ks8Z11T3cSqk-uo.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202505/01/9aQv4le-jfueZeT3cSsg-il.jpg[/img]
[img]https://img.nga.178.com/attachments/mon_202505/01/9aQv4le-6ks8Z11T3cSqk-uo.jpg[/img]
在9070的vbios里,现阶段使用MCT(MPT整合后的新名字)或者其他工具解包powerplay table,可以在里面有根据不同厂商的差异设置的不同上限值,这一条在7000系上可见不到:
[img]https://img.nga.178.com/attachments/mon_202505/01/9aQ68w8-4aqtK1tT1kSgg-87.jpg[/img]
其中,第一个大概是广义的温度墙,和hwinfo的限值对应,而第二个大概是硬性的THERMTRIP温度墙(强制断电),避免带来硬件损害。镁光的温度限值比海力士低一些,恰巧前边的跨代对比里,镁光的结温温差确实也比海力士低一点,很有可能是维持Tcase在工作温度范围内的实际结温。在这里做出差异恰好是应对了厂商数据手册不同的特点。然而现阶段里边并没有三星,而且三星显存版的9070目前也是套用海力士的温度上限 (108℃),不确定以后是不是会多一个出来(