
本文成文于2025年8月下,写本次专栏的起因是一次评论区的交流。
有个老哥问了我一个问题:他和我用的是一样的CPU——14700k,散热器——VK的B360,导热材料用的也是VK冷头上自带的,只有主板的不同,但他放在开放式固定板上烤机的时候,温度比我的烤机高了快10°,想咨询我可能的原因有哪些?
我第一次的回复的时候也不以为然,毕竟主板不同,很多东西不好说的,只能通用性的让其控制下进气的温度。后来那老哥是真的较真,不死心的换了块和我同款的教主的终结者D5,甚至和我一样升级到最新的BIOS后再测试,配合上开空调控制室温,我俩的烤机温度差降低到了4°左右。
第二次我就把我之前控制进气温度的一些努力和他进行了分享:
1.京东10-20块的温度检测仪的精度和更新速度都比较有限:
第二轮导热材料测试开始,更高散热压力,更准确的温升测量方法
2.民用空调作为控温设备,对于温度的控制其实是很糙的,特别是小空间内,即使用变频空调,实际温度也会有+-1°的波动
前两个因素叠加,误差会在+-1.5°左右,离他所说的4°的温差就非常接近了。
他也接受了我的解释,但我自己把整个逻辑链条缕了下,好像有个地方我忽略了,就是芯片本身的测温精度问题。
关于此,我查询了资料,发现有点意思。
首先是我用的14700K的这款CPU的温度传感器的分辨率就不高,只有1°,没有对应的中间值,比起京东上买的温度检测仪的0.1°的分辨率差远了。
14700k的温度监控里就没有小数点

京东上的温湿度计的分辨率都是0.1°

多说一句,AMD的至少温度传感器的分辨率是0.1°,还是强点的

除了分辨率低以外,还不怎么能保证精度,比如对14700K而言,intel对于内部的温度传感器的精度只能保证在+-5°以内。

最极端的案例就是其他变量都控制的一模一样的情况下,只要更换一颗CPU,烤机温度可能从80°降低到70°,甚至这都是intel概念里的合格品。所以可以推理出两个重要的注意点:
1. 那个老哥烤机怎么都和我有4°的差距,里面肯定有一部分芯片本身差异的因素
2. 导热材料的性能对比实验务必在同一台CPU上进行,用不同CPU,即使型号完全一致,其烤机成绩的参考性都大打折扣。
对于准确性我还得多说两句
1. intel标称的准确度其实是个最大值,算是个“甩锅”的公告,我把最大值标出来,你就不能用我的测试结果不准来揶揄我,不准的问题我提前自己点出来。
2. 准确度不高,不代表没法做导热材料相关的实验。
A. 因为准确度可能不太对,但是正相关肯定能保证,孰强孰弱的定性测试肯定是对的
B. 如果准确度仅仅是基准值有个偏置(offset)的话,甚至连测试温升的结果都是对的
C. 从这个准确度如何计算出来出发,一般这个所谓的最大温度偏差值,是用正态分布假设的三sigma原则推理出的估计值,并不是intel真的在ES和QS阶段,实际检测到了这么大的温差,70%左右的CPU应该还是在一sigma范围内的,简而言之,你拿到的CPU的精确度7成以上的在+-1.67°以内的。
写到这里,估计会有老哥问,intel为啥不把温度传感器的精度做高一点呢?
答:没啥动力。因为intel在内部设置传感器,主要为了保护晶体管,而晶体管烧毁,得到125°左右,对于中低温的测温精度,对于intel几乎没有意义。核心现在是70°还是80°不影响其运算结果和运算频率。
而提高温度传感器精度,是切实的需要成本的。要么就是改进芯片内部测温二极管的精度,这需要增加对应二极管的面积,对于寸土寸金的die来说,面积就是钱。另一条路是给每个芯片做标定,内部做一定的数据补偿。这样增加工序,等效还是加钱。
最后一合计,intel宁愿选择还是把降频温度降低一点(Tjmax=100°),流出更多的裕量保护晶体管,提高精度的事情就搁置一边了。
通过上面问题,其实也就部分回应了我在标题里写的问题“导热材料原厂们为啥不喜欢用芯片测?”
答案很简单:实际芯片最重要的完成计算任务,测温只是保护和监控用。而对于导热材料原厂们来说,最重要的就是测准温度。
拿用的最多的美标D5470标准——稳态热流法测试热阻和导热系数操作来看:

只需要精确的测定原理图上6个黑点处的准确温度,和热源输入的准确功率,就能计算材料的热阻和导热系数。
就像我上面说的情况,对于实际用的芯片来说,测出来的温度没法准确,自然推导出来的热阻和导热率都不准。
不仅如此,在另一个需要精确测定并且控制的变量——发热功率上,实用的芯片也没法搞的很准确,主要原因还是成本。
比如我找到的笔记本上已经闯出半边天的MPS公司的Drmos的介绍手册。
由于成本原因,只能用精度比较低的DCR(6-8%)和on die(3%)的电流检测,比较准确的shunt电阻和霍尔方案就不要想了。

这种电流和电压精度下的总体发热功率也不怎么准确。所以发热源侧,测导热材料的厂商们也更倾向于用更加简单的合金发热片就完事(电阻原理)了。
综上来看,实际用芯片测导热能力的话,发热功率不好控,芯片本身温度也测不准,该方案被抛弃也不奇怪。
但是“失之东隅收之桑榆”,在现在这个高端制程芯片的热流密度越来越高的情况下,对于导热介质材料的pump-out现象的模拟,前述的标准热流的稳态方法就非常无力了,反而是用实际芯片既便宜,还更有效,当然这又是另一个故事了。
最后说点对于一般人来说,如何获取手里导热材料准确的热阻和导热率呢?
看预算,整体来说,相当丰俭由人。
最便宜的,去闲鱼上搜导热系数代测,一堆人干这活的,一般150一次,只是稍微验下买的导热材料有没有虚标的话,这样最省事,还能开发票。如果一次测5个以上,一般都还能谈价的。

第二便宜的,去耐驰(德国的,卖此类仪器的)官网找测样服务,这样能选激光法还是热流法。

比较贵的:去淘宝买个国产的仪器,国内做这个的厂子好像也不算多。这个仪器我看的要4-5W的,如果真的需要天天测,价格倒也还行。
最花钱的就是买国外几个老牌厂子的专门仪器,比如前面说的德国耐驰的,瑞典hotdisk的,还有台湾瑞领的,性能和准确性,应该比国产的还是要强点的。
比如莱尔德测试报告里出现过的瑞领的LW-9389,特点就是显示屏特别丑,特别复古。。。。
