勘误,芯片和芯片的体质不能一概而论,台式机与笔记本用的主芯片们是其中的“体育生”
serebiij10
2024年09月19日 19:34
收录于文集
共19篇

本文成文于2024年9月中,这次不仅准备完结掉整个的扭螺丝(散热测试平台搭建过程介绍)系列,更是对我之前的搞错的几篇专栏的勘误。如果硬要省流的话,可以浓缩成一句话:现在台式机和笔记本的CPU和GPU比我之前估计的耐糙多了,能承受不小的压力。

去年的时候,我的好几篇专栏其实都间接的讨论过一个问题:“对于笔记本与台式机的主芯片(CPU和GPU),散热器提供多大的压力是合适的”。研究此问题的初衷是为了了解TIM在芯片和散热器之间的工作状态和其对导热性能的影响。这个问题看似简单,但是网上参与讨论者甚多,但是能安心下来研究资料者寥寥,最后多半沦为完全控制不了变量情况下的“身边经济学”和进化版的“俺寻思之力”。我当时想通过查阅些资料来解决此问题,所以下面的几篇专栏里,都有我对找到的资料的一些解读。

我刚用上PCM800X,泰吉诺的新品PCM900就出来了,对比发现它和汉高竟然英雄所见略同​

相变化散热材料在裸die芯片与有顶盖服务器CPU上都是版本答案,水冷系统上一般​

2023年笔记本用散热硅脂及相变材料理论性能对比与推荐​

甚至由于此问题,缺乏权威的直接资料,我写的这几篇间接讨论专栏甚至还被现在逐渐流行起来的AI用作相关问题的重要参考。特别是文心一言和通义千问里面,问裸die芯片的散热器压力问题,我的那几篇专栏都在参考的前列,让我有点没绷住。。。。。。

没绷住的重要原因是,我最近在研究散热测试相关内容的时候发现,我之前的关于笔记本及台式机主芯片们承受压力的估计,大概率有问题。之前参考的资料,存在或多或少的局限性,难以用来作为最近的芯片们特性的参考了。而翻到的芯片厂的直接资料又更进一步的支持了这点。

这部分比较长,且听我一个个说过去。

先说几个我见过或者展示过的芯片压力必须小一些的几个证据,看看他们的局限性。

1.首先是一张芯片公司给出的,芯片压力和失效率(图中是成功率,反一下就是失效略)的统计图。

基础规律肯定是没啥问题的,无论如何,芯片肯定无法无线提升自己的耐压力,压力高了,失效概率肯定也要变高的。但是问题在于大家有没有发现,图的标题,竟然拿了个大小写都不太正常的词“ChiP”做了主语,这也太山寨了吧。我研究过后,发现不是这样的。

这个得翻到原文的第一段,这个文档的本质其实是vicor这个电源芯片公司对于自己的产品线的2款主打系列“ChiP”和“SM-ChiP”芯片的压力建议说明,所以我们得看看,这2个系列都是啥芯片。

看了之后我就明白为啥这2个系列芯片的抗压能力不太行啊。

ChiP产品芯片的封装,其实就是老式DIP封装技术的优化版,对于芯片和PCB间接面积触实在太少,其抗压能力弱于一般水平是非常正常的

另一个相关的“SM-ChiP”系列芯片也不遑多让,它是上述ChiP芯片的贴片板,虽然与PCB的接触不再是直插,而是变成了紧贴+焊接了,但是接触面积其实还是不大,明显也不是抗压很好的构型。

综上来看,由它们2个读书苦手来推论整个班的均分肯定不合适。常用CPU和GPU抗压肯定比它们强。

 再看第二个我之前看intel服务器打击时候列出来的我以为的压力相关数据,今天的我起眼就能看出问题来,就是压力主体搞错了。这个压力明显是液冷系统的压力,而非散热器的压力,甚至连我标红的那行里面有at chassis inlet的字样,直接翻译过来时底盘输入口,应该是它液冷系统的哪个输入点的位置吧,反正和散热器八竿子打不着,我当时能把这个联系上,纯粹是写迷糊了。。。。。。

另一个和压力相关的文献是安华高关于1mm pitch BGA封装芯片的一偏说明里面提到,裸die设计长时间20psi,有盖设计长时间不超过30psi。由于笔记本的主要芯片多也是BGA封装的,说这文献完全没有参考性是不客观的。但是能参考的程度不多

首先,这个文献太老了,是13年5月做出来的,而且放在现在也没有过修订版,11年前的相关参数肯定和现在不一样。

如果考虑到时间这个维度,就能够发现,13年5月那时候的安华高还不是现在啥都买买买的地主家的傻儿子,当时买的东西至少还和它自己的老本行,光学多少有点关系,所以那个时候它家的BGA封装芯片很少,甚至现在去网上搜,完全找不到痕迹了,现在在安华高官网能搜到的BGA封装的芯片多是后来它收购来的LSI,PLX和博通的芯片派系。所以那个时候的安华高在BGA封装上,由于用的少,保守点是很正常的

而即使不从时间这个角度,1mm 间距BGA的数据也很难直接用在现在的新品上,我查了下对应的intel的12-14代桌面版和移动版CPU的数据,桌面版最小间距0.8mm,而移动版甚至可以是0.65mm甚至0.4mm。所以,安华高老文献不能光看到那几个压强的数据,还需要看到,对于计算的耐受压强,有个显著的影响因素,就是锡球的数量。老文献里也写了每个锡球按照多少力量计算,这并不难理解,PCB上承力靠的锡球,其数量越多,能承受的力量也越大。而间距小了后,意味着单位面积的锡球数量明显提升了,再加上本身BGA锡球材质的优化,工艺的优化,现代CPU和GPU能承受的压强肯定比安华高老文献报告的要高不少。

那具体高了多少呢?这就得找点时间相近点的资料。还好,intel虽然最近几年各种颓,但是文档上还是比较公开的。查看了资料后发现,台式机和笔记本是不一样的。得一个一个说。

首先对于最新的12-14代台式机CPU,intel是给出明确数据的。

这个数据表,比较值得说的有2点

首先就是压力是有个范围的,里面intel考虑到了可能的老化过程,所以在开始的时候,压力可以弄得非常高,但是后来随着使用,散热器压力应该降低。

当然这个最高压力,更多的是intel给造座子的生产商的要求,我们用户其实不需要管那么多。而对客户来说,更有用的其实是那个最低压力,它是intel保证完整性能的一环。我们由此可以反推下intel建议给台式机CPU的压强是多大

12-14代CPU的顶盖大概是1073mm^2,所以均匀承受400N压力的情况下的压强是0.3728MPa,对应转换到常用的英制单位54psi后发现,比起安华高老文献其实是高了不少的

既然知道了方法,我们还可以计算下安全最大压强是多少。算出来是114psi,比我想的大不少,台式机由于有顶盖,是真的耐糙

AMD那边虽然八爪鱼的等效受力面积稍微小一点,但差的不多,应该可以直接套intel的数据。基于上述信息,我给出我的建议,台式机的合理压强在40-54psi之间

而笔记本,问题比较复杂,因为intel没写最新的12-14代移动端CPU的压力相关数据。最近的数据只能参考11代的

有个有趣的现象值得一说,intel特意做了die本身强度的实验,实验表明,只要压力够平均,die本身抗住长期的800psi是没啥问题的,这硅片强度也比我想的高不少。当然,注意前提,需要压力均匀。如果如图只给芯片一边压力,歪斜着压的话,芯片肯定扛不住。

11代的按照11代的压力(注意单位换算,25lbf=111.2N)说明配合网上找到的die的大小资料,不难推出,其承受压强最大也有51psi,也是比我之前估计的强不少,至少TIM普遍需要的40psi是完全承受的了的

当然,芯片能承受较大的压强≠笔记本散热器能产生足够的下压力,这其实也是个复杂的问题,好在它已经不在本文讨论的范围内了。由于笔记本情况的复杂性,其实给不了和台式机那样的通用建议,个人主观建议是即使有能力,也只设置压强到40psi就足够了,没必要搞极限挑战,如果散热器如果产生不了那么大压力也就算了吧,也千万别硬来,裸die芯片怎么都没有带顶盖的容错性高。

 

文章到这里,芯片需要什么样的压强的问题也算告一段落了,这其实是我之前那篇专栏的问题A。那么正好,我准备弄个融会贯通。给大家演示下如何使用学到的方法,正确的扭螺丝:

A.确定需要的芯片压强,这里我就偷个懒,那我这次搭建的台式机LGA1700平台距离。按照说明书里该封装最小400N来,正常情况下,应该从设置的压强X面积计算出下压力的。

B.为何获取此压强螺丝需要多大的扭矩,带入公式计算就好(台式机专用)

(3.14*T)*0.1/D=F

由于intel扣具可以上4个螺丝,F=400N/4=100N。此时可能需要了解的是螺距D,对于瓦尔基里VK B360来说,它使用M3螺丝,所以标准D螺距就是0.5mm,带入后可以算出螺丝扭矩T=0.16Nm。

C.按照此扭矩设置扭力螺丝刀的目标值,并且开启pre模式,按照对角法扭3-4次螺丝,确定四个角压力都平稳且到位

D.如果在C步骤前已经把对应的压敏值重合并且塞到CPU和散热器中间的话,等待2分钟,之后再把试纸拿出来对比标准色卡,如果之前已经校正过了,跳过这步,直接用就行

 

终于,困扰我一年多的疑惑总算有了明确的答案,而且也算是把我之前专栏里的好些个错误点都拖出来指正了一下。并且就台式机和笔记本芯片的合适压强及对应的安装散热器方法也算给了点能用的建议。不过我在写到此处的时候,更多想反思下我之前专栏里的错误怎么来的。我觉得有3点值得警惕的。

1.高级的误导就是“不说假话,但真话不全说”,小心高级软文的inception操作。我现在审视我对于芯片压力的最初认知,来自于当时汉高想推自己的THF 5000UT相变(数据我已经测完,下次发结果),在网站上让人写的软文。反复强调自己的低压力特性好,其中作为此性能必要性的论据的也就是我之前说的过的2篇参考文献。这两篇参考文献写的东西有问题吗,至少原文没有,但是结论对于现代和其他家的芯片适用吗,不适用。如果真的不去了解前因后果,无脑相信里面的结论,就会变成去年的我。甚至拿这错误的结论反复自我加强。这种软文的鉴别其实特别困难,只能说看到最后开始推荐的文章,得擦亮严谨,多个怀疑总没有错。

2.不能先入为主,之前的先入为主,甚至产生了把水冷入口压力直接当做散热器压力的绝对低级的失误,怎么看都应该可以避免掉的。想想还是因为原因一,被植入了芯片压力不能高的潜意识,所以才会看错。证明自己已经相信的东西,很容易出纰漏的。所以切忌先入为主

3.资料尽量要看最贴近的原文,真理的适用总是有条件的。