1 概述
1.1 冷板
1.1.1 冷板描述
1.1.2 冷板类型
1.1.3 冷板制造
1.2 冷板组装
1.3 冷板技术冷却系统
2 开发要求
2.1 机械要求
2.1.1 冷板机械设计
2.1.2 冷板流体接头
2.1.3 冷板冷却回路集成
2.1.4 冷板外观要求
2.2 热性能需求
2.3 可靠性需求
2.3.1 静水压力
2.3.2 腐蚀
2.3.3 动态特性
2.3.4 温度循环
3 测试方法
3.1 机械测试
3.1.1 尺寸
3.1.2 结构
3.1.3 冷板集成
3.1.4 外观
3.2 性能测试
3.2.1 热性能
3.2.2 冷板流体压降
3.3 可靠性测试
3.3.1 静水压力测试
3.3.2 腐蚀测试
3.3.3 动态特性
3.3.4 温度循环
4 总结
1 概述
本节通过描述冷板的设计变体、制造工艺、组装流程以及冷板冷却回路的基本示意图和术语,介绍冷板技术。冷板设计与测试方法直接影响其液体冷却性能和可靠性。本文档适用于IT设备(ITE)单相冷板的开发与测试,可用于指导冷板的设计、性能测试和可靠性评估。
1.1 冷板
1.1.1 冷板描述
冷板是带有集成管道或流道的散热器,允许液体流经散热器以耗散热量。冷板安装在处理器和其他需要冷却的电子元件上,为热量传递至冷却液提供路径。冷板设计可分为单相或两相冷却液类型,并可针对特定冷却液优化设计以最大化散热性能。例如,简单的冷板可能为带有集成管道的金属块,而复杂设计则可能包含铣削或模塑微流道以增强热性能。
对于带集成管道的冷板组件,冷板通常由包含流道的流体热交换器和固定支架组成。流体热交换器通过焊接、钎焊或软钎焊等金属连接工艺与管道连接。对于使用机加工或模塑流道的冷板,其组件包括流道热交换器、固定支架和流体连接器(图1)。流体连接器安装在热交换器上,引导冷却液流经流道。连接器通过卡箍固定在管道上,而固定支架则为组件堆叠提供结构支撑,并确保热交换器在处理器上的精准定位。
图1:冷板组件示例
带有流体流道的冷板热交换器由两部分组成:一个带有机加工或模塑流体流道的冷板基座和一个顶盖。冷板基座与顶盖通过优化设计的制造工艺连接,该工艺需根据冷板材料特性进行调整,以确保基座与顶盖之间的接口完全密封,从而保证冷板在整个使用寿命期间不会泄漏。流体热交换器是冷板的核心冷却组件,流体连接器通过管道将冷却液导入流道中循环流动。
冷板基座设计为与处理器直接接触。在处理器与基座之间需涂抹兼容的TIM2(第二层热界面材料),以提升冷板散热方案的性能。冷板顶盖用于封闭流体流道,并通常集成流体连接器,用于引导冷却液流经流道。
流体流道是冷板热交换器的关键特征。冷却液流经这些流道时,通过与流体的接触将处理器的热量带走。流道被精确布置在冷板基座与顶盖之间,其设计通常采用机加工或模塑工艺,集成于基座或顶盖结构中,以确保流道在流体流动过程中保持机械稳定性。图2展示了一种冷板基座集成机加工流体流道的设计示例。
图2:冷板流体热交换器的示例
冷板流体接头安装在冷板的流体热交换器上,作为冷板与冷却液循环之间的接口。冷板流体接头的设计可以针对特定的流速、系统尺寸公差和流体循环配置进行优化,同时尽量减少流体停滞。在整个冷板使用寿命期间,冷板流体接头的设计和安装需要确保密封无泄漏。
1.1.2 冷板类型
冷板可以分为一体式冷板(见图3(a))和分体式冷板(见图3(b))。一体式冷板中,流体热交换器和保持支架是集成在一起的,不可分离。由于保持支架集成于冷板设计中,使得一体式冷板难以跨处理器代次重新部署。而分体式冷板的流体热交换器和保持支架是分开的组件。这种模块化设计支持通过重新设计适用于更新处理器系列的保持支架,并重复使用流体热交换器来实现跨多个处理器代次的重新部署,作为一种节省成本的选择。两种类型的冷板示意图如下图3所示。
图3:一体式和分体式冷板类型的示例
1.1.3 冷板制造
组装热交换器的顶盖板和冷板基座的主要制造工艺包括钎焊、摩擦搅拌焊接、软焊以及基于O型圈的密封。下表1描述了用于组装冷板热交换器的具体制造工艺的一些优点和缺点。
表1:冷板制造工艺对比
1.2 冷板组装
冷板组件由冷板、冷却液管道和快速接头组成。可选的冷板组件包括转换连接器和泄漏检测硬件,可根据客户产品设计需求集成。冷板组件的示意图如图4所示。支持冷板所需的附加组件说明如下:
-
冷却液管道:从冷板冷却回路向冷板输送冷却液。金属材质可选铜或铝,非金属材质可选PTFE(聚四氟乙烯)、PEX(交联聚乙烯)或EPDM(三元乙丙橡胶)。管道材质需根据冷板流体连接器的类型和设计选择。泄漏检测线缆/绳可通过缠绕在流体管道和冷板连接器周围集成。
-
快速接头:支持快速断开冷板与冷却回路及IT设备的连接,便于维护操作。
-
转换连接器(可选):用于在冷板组装中连接冷却液管道与快速接头。
-
泄漏检测(强烈推荐):在检测到泄漏时向数据中心操作员发出警报。
1.3 冷板技术冷却系统
冷板技术冷却系统由IT设备(ITE)、冷板、冷却液管路、快速断开接头(QDs)、刀片集管、二级冷却回路、冷却液分配单元(CDU)、设施水系统(FWS)以及冷却塔或冷水机组组成。该技术冷却系统以恒定的温度和压力向冷板供应冷却液。图5展示了一个冷板液体冷却系统的示意图。冷板技术冷却系统中的所有湿润材料都需要与冷却液兼容。
2 开发要求
2.1 机械要求
2.1.1 冷板机械设计
冷板需要满足处理器供应商为处理器热解决方案规定的全部结构要求。请参考处理器的热和机械设计规范,以获取关键冷板机械要求(如质量、平整度等)。除了处理器供应商定义的冷板要求外,冷板还需要满足以下机械设计要求:
-
冷板设计需符合产品设计要求,遵守产品的禁区(Keep Out Zone, KOZ)要求,并结合固定硬件的接口控制图(ICD)要求。 -
由冷板固定硬件施加到处理器上的机械负载应符合处理器规格和要求中定义的封装加载要求,并在整个冷板使用寿命期间保持合规。 -
冷板的安装和拆卸需符合处理器的设计和制造规范。 -
冷板底面的平整度可能影响机械和热性能,应按照冷板性能要求进行规定。 -
冷板底面的平均粗糙度(Ra)应根据冷板机械和热性能要求进行规定。 -
冷板底面在X和Y方向上与处理器集成散热器(IHS)或芯片区域接触的尺寸可能影响热性能,应根据冷板性能要求进行设计。图6中的蓝色轮廓代表了处理器的IHS或芯片区域。
-
冷板的高度需要适合产品机箱。冷板的高度是从冷板基座的底面到冷板流体接头顶部的距离。
2.1.2 冷板流体接头
冷板流体接头需要满足以下要求:
-
在静水压力测试过程中,冷板接头与冷板热交换器接口之间不应有泄漏或变形。 -
在静水压力测试过程中,冷板接头与冷却液管路之间不应有泄漏或变形。 -
设计上应防止流体停滞或气穴现象。
2.1.3 冷板冷却回路集成
为了将冷板集成到冷却回路中,需要考虑以下要求:
-
冷板接头的位置和方向需考虑到产品冷却液管路的布线。 -
技术冷却系统中湿润金属的电极电位差应尽可能小,以防止冷板腐蚀。如果湿润材料列表中包含不同的金属,则强烈建议执行一个综合腐蚀认证计划,评估不同金属在冷却液中的腐蚀潜力。 -
冷板设计中的任何金属-金属界面的电化学电位差不应超过0.15V,以防止电偶腐蚀。 -
微通道冷板热交换器设计中的鳍片厚度、鳍片高度和鳍片间距会影响流体流速能力和整个冷板组装的流阻。 -
整个冷板组装的流阻需要低于冷却液泵提供的流体压力。
-
-
建议了解冷却液流速随温度变化的情况(如图8所示),以评估是否需要根据季节性温度变化调整冷板流体流速。
2.1.4 冷板外观要求
冷板应符合以下外观要求:
-
冷板顶盖应光滑,无可见缺陷和变形。 -
冷板基座底面应无可见缺陷和变形。 -
冷板固定支架应无可见缺陷和变形。 -
冷板流体接头应无可见缺陷和变形。
2.2 热性能要求
冷板的性能需要满足处理器供应商提供的热规格中规定的处理器温度要求,以确保产品在其使用寿命期间的性能。为了确定冷板的性能要求,需定义以下热边界条件:
-
根据处理器热规格,不应超过的处理器温度。 -
冷板技术冷却系统提供给处理器的冷却液温度和流速。 -
输入冷板的最大冷却液流速应低于1.5米/秒,以防止冷板组件的侵蚀。
-
2.3 可靠性要求
2.3.1 静水压力
冷板需按照IEC FDIS 62368-1标准进行静水压力测试,且不应有可检测到的泄漏或机械变形。静水压力测试前后的冷板尺寸应统计上等效。
2.3.2 腐蚀
- 流体兼容性
冷板湿润表面需要与冷却液化学兼容并耐腐蚀。冷却液中的杀菌剂和防腐剂浓度需维持最低浓度,以在与完整的冷却回路湿润材料列表一起测试时为冷板提供生物和腐蚀保护。 - 盐雾测试
冷板需根据ASTM B117标准完成盐雾测试,以评估外部冷板表面的耐腐蚀性。盐雾测试完成后,不应观察到冷板表面有任何腐蚀、点蚀或变色现象。建议在盐雾测试后对冷板组装进行静水压力测试,以检测由于冷板材料降解导致的泄漏。
2.3.3 动态特性
- 冲击
冷板需完成符合产品认证标准的冲击测试,并在冲击应力后进行静水压力测试以检测泄漏。冲击测试后的冷板热性能应统计上等效。 - 振动
冷板需完成符合产品认证标准的振动测试,并在振动应力后进行静水压力测试以检测泄漏。振动测试后的冷板热性能应统计上等效。
2.3.4 温度循环
建议冷板完成一个温度循环测试计划,并在之后进行静水压力测试,以检测由于运输或操作温度极端条件与制造工艺之间的相互作用而导致的泄漏。
3 测试方法
3.1 机械测试
3.1.1 尺寸
使用以下测量方法验证冷板的尺寸是否符合冷板产品要求:
-
使用游标卡尺测量冷板的高度。 -
使用游标卡尺测量冷板内流道的长度、宽度、间距和高度。 -
根据ISO 12781-2:2011标准测量冷板基座底面的平整度。 -
根据ISO 21920-2:2021标准测量冷板基座底面的粗糙度。 -
使用X射线或其他类似的成像技术检查流道鳍片是否存在变形、损坏或异物。
3.1.2 结构
参考处理器的技术规格以获取关键结构要求及推荐的测试方法,以验证冷板热解决方案的结构要求(如质量、平整度等)。
3.1.3 冷板集成
为了确认设计满足冷板组装要求,冷板需要完成以下验证:
-
使用X射线或其他类似分析方法检查冷板,检测冷板热交换器上的制造缺陷,如空隙、流道异物、焊接质量等。 -
验证分体式冷板的冷板热交换器和固定支架是否能够无干涉地装配在一起。 -
检查冷板接头,确认其规格(如尺寸、倒钩配置、方向等)是否符合产品设计要求。 -
将冷板集成到产品冷板组装中,并进行静水压力测试,以确认流体交换器与接头及冷却液管路之间没有泄漏。
3.1.4 外观
根据工厂外观检查标准对冷板外部进行目视检查,并确认满足1.2.1.4节的要求。将冷板热交换器浸入超声波清洗槽或类似功能设备中,用透明液体冲洗,然后检查排出的液体是否有变色现象,以及冲洗液中的颗粒大小是否小于50μm。
3.2 性能测试
3.2.1 热性能
将带有推荐的TIM2材料的冷板安装在代表产品板上的热功能对应的处理器堆栈上,并将冷板热交换器连接到冷却液循环中。在开始热性能测试之前,确保冷却液测试回路中没有气泡。稳定通过冷板热交换器的流体流速,并对处理器施加功率。保持恒定功率设置直到壳温(Tc)和进液温度(TL)稳定。当达到稳定时,记录通过冷板组装测量的压力降、处理器的壳温(Tc)、进液温度(TL)、施加于处理器的功率(Q)以及通过冷板热交换器的流体流速。
特定冷却液流速下的冷板热阻通过以下公式(1)计算:
- R—冷板热阻,单位为℃/W
-
Tc—测试中热组件的壳温,单位为℃ -
TL—测试中冷板入口处的流体温度,单位为℃ -
Q—施加于测试中热组件的功率,单位为W
3.2.2 冷板流体压降
使用图10a作为指导,配置一个实验室台式技术冷却系统(TCS)回路,包括冷板、冷却液管路、快速断开接头和冷却液分配单元(CDU)。在冷板冷却液入口和出口管路之间连接一个数字压力计(例如Omega DPG409-015G)。从CDU以恒定流速向冷板供应液体,并记录压力计的压力。按照实验配置10a断开冷板与实验室台式TCS回路的连接,并将冷却液入口和出口管路直接连接在一起,如配置10b所示。在同一CDU流速下,记录实验室TCS配置10b中的压力计压力。冷板的压力降是实验设置10a和10b在同一CDU流速下记录的压力之差。冷板冷却液流速对冷板流阻的影响如图9所示。
图10:测量冷板压降的方法示意图
冷板的压力降必须低于技术冷却系统(TCS)提供给冷板的冷却液压力,以确保正向冷却液流动。为了满足热性能要求,冷却液流速目标需要补偿预期的冷板压力降。
3.3 可靠性测试
3.3.1 静水压力测试
静水压力测试是检测在正常和预期操作条件下是否存在泄漏的关键质量和可靠性测试。有两种行业标准可用于定义静水压力测试方法:
- 欧洲标准EN 1779
定义了使用加压气体进行泄漏检测的方法: - 压力衰减测试
:测量冷板总压力的减少量。建议压力降小于0.5%。 - 浸入气泡测试
:冷板被加压并浸入液体中。通过冷板周围形成气泡或气泡流来检测泄漏。
- 压力衰减测试
- UL Solutions标准IEC FDIS 62368-1
定义了静水泄漏测试的加压时间和安全系数。这些测试可以使用气体或冷却液对冷板进行加压: -
将冷板加压至最大工作压力,并在5分钟后检查冷板及其接头是否有泄漏。 -
将冷板加压至最大工作压力的3倍,并在2分钟后检查冷板及其接头是否有泄漏。
-
3.3.2 腐蚀测试
- 流体兼容性
冷板技术冷却系统将由与冷却液接触的金属和聚合物/弹性体材料组合而成。冷板的可靠性取决于冷却液与所有湿润材料之间的化学兼容性。冷却液需为金属组件提供可靠的防腐保护,并防止从聚合物和弹性体组件中析出污染物。某些聚合物/弹性体材料可能会吸收冷却液中的防腐剂化合物,从而降低冷却液中防腐剂的浓度。湿润材料列表需要证明冷却液的兼容性,并推荐一些评估方法包括: -
使用ASTM标准D2570进行冷却液与金属的腐蚀和材料兼容性测试,评估循环冷却液对金属试样的影响,以检测控制实验室条件下的电偶腐蚀。 -
使用ICP(感应耦合等离子体)根据ASTM标准D6130、D5185测量溶液中的金属离子浓度,以识别早期腐蚀迹象并安排预防性维护。 -
根据ASTM标准D1287和D1121进行冷却液的pH值和储备碱度测试,以测量储备碱度和pH值的下降,并识别由于乙二醇降解成乙醇酸而导致的冷却液劣化。 -
使用离子色谱法根据ASTM标准D5827测试冷却液中的氯离子和其他阴离子浓度,以测量导致金属点蚀的活性阴离子浓度。 -
使用气相色谱(GC)和液相色谱(LC)测试冷却液,跟踪有机防腐剂浓度并识别其他渗入冷却液中的有机污染物。
-
- 盐雾测试
应根据ASTM B117标准在盐雾室中进行盐雾测试,以评估冷板外部涂层的耐腐蚀性。冷板表面的钝化或阳极氧化可以降低盐雾测试中的腐蚀风险。 密封冷板的入口和出口,并将其样本放置在温度为35℃的盐雾室内。 -
NaCl溶液的质量比浓度为5% -
NaCl溶液的pH值为6.5~7.2 -
盐雾喷洒量约为2ml/小时/80cm² -
暴露测试时间为8小时 在盐雾测试后应测量冷板的热性能,并且不应有统计上显著的热退化。还建议对完成盐雾测试后的冷板进行静水压力测试,以检测因腐蚀测试导致的材料退化而产生的任何泄漏。
-
3.3.3 动态特性
- 冲击
将冷板安装到代表性产品板上的对应产品CPU堆栈上,并执行符合产品认证要求的冲击测试。进行目视检查以确认冷板在冲击应力后仍符合外观要求,并且CPU堆栈或代表性产品板未受损。对已安装的冷板进行静水压力测试,以验证冲击应力未导致冷板及其接头出现泄漏。 - 振动
将冷板安装到代表性产品板上的对应产品CPU堆栈上,并执行符合产品认证要求的振动测试。进行目视检查以确认冷板在振动应力后仍符合外观要求,并且CPU堆栈或代表性产品板未受损。对已安装的冷板进行静水压力测试,以验证振动应力未导致冷板及其接头出现泄漏。
3.3.4 温度循环
将带有推荐TIM2材料的冷板安装到代表性产品板上的热功能对应的处理器堆栈上,并执行符合产品认证要求的温度或功率循环测试计划。温度范围应覆盖冷板操作温度的全部极端情况,循环次数应针对处理器使用寿命期间估计的处理器功率循环次数设定。完成温度或功率循环测试计划后的冷板热性能需要满足产品认证要求。对已安装的冷板进行静水压力测试,以验证温度循环应力未导致冷板或其接头出现泄漏。
4 总结
冷板设计的技术要求和认证对冷板的性能和可靠性有着重要影响。本文档描述了优化冷板技术开发的推荐要求。讨论的冷板要求包括机械要求、热性能要求及可靠性要求。同时,文中也提供了用于验证冷板设计的机械、热性能及可靠性的测试方法。
开发高效且可靠的冷板需要来自冷板设计和开发各个领域的行业专家的贡献。这也要求以数据中心客户为中心,推动专注于冷板性能能力、冷板可靠性及制造过程控制的设计要求,从而设计出高效且具有成本效益的冷板解决方案。
以上翻译整理自:OCP《WHITE PAPER: COLD PLATE DEVELOPMENT AND QUALIFICATION》。