光宝LITEON GPU 电源解决方案

过去几年,如果你一直关注 AI 基础设施,就会发现一个越来越明显的趋势:算力涨得太快,而电力系统却在极限边缘挣扎。GPU 的升级节奏堪比“坐火箭”,但如果电源跟不上,再强的 GPU 也发挥不出实力。
因此,数据中心电力架构正在经历一场大换代。从 2017 年合作 NVIDIA 的 3.3kW GPU 电源模块开始,到后来为 OpenAI 提供 5.2kW 的电源方案,再到现在和未来的 800VDC 高压直流系统,Lite-On 基本参与了过去三代 GPU 的电力演进。很多人看到 GPU 性能翻倍,会忍不住感叹“又强了”,但背后电源压力每年也在翻倍。服务器内部早就塞不下更多 PSU 了,所以电源从机内被“挤”出来,转向机架级的 Power Shelf;而再往前,就发展成了机柜旁边独立存在的 Power Rack(Sidecar)。这不是设计师的奇思妙想,而是算力密度逼出来的现实需求。
Lite-On 的电源路线图也很清晰:原本的33kW、110kW Power Shelf 已经在 A100、H100 时代被大规模采用,现在则开始全面转向 800VDC 解决方案。原因很简单——未来的 AI 集群功率越来越夸张,50V 母线已经撑不住了,要么电缆粗到不现实,要么传输损耗大到浪费。所以行业几乎达成共识:要进入 300kW~1MW 的整柜时代,就必须走向 800VDC。 Lite-On 不但跟上了,还直接推出了完整的 800VDC 线:从 PSU、Shelf、Rack 到 1.2MW 的侧挂机柜,一口气把“未来电源的样子”摆在了桌面上。
尤其有意思的是,Lite-On 在 NVIDIA GB300 NVL72 项目里,扮演的不只是电源供应商,而是负责“输入功率平滑”的关键角色。简单讲,GPU 的负载跳变像过山车一样突然,如果电源响应跟不上,就会造成电力波动,影响整个机房甚至引发保护动作。而 Lite-On 的方案,通过更高能量密度的电容设计、改进的瞬态响应,让 GB300 在大模型训练时输入更平稳、更安全,这也是它能成为多代 GPU 的指定伙伴的核心理由。
Lite-On 的新款 110kW Power Shelf 采用三相整流,天然具有输入电流均衡和纹波抵消的优势,这让电容压力骤降,能量存储密度反而翻倍。不仅如此,它在 step loa时的输入电流斜率也更平滑,这直接决定了整个系统在模型训练阶段的稳定性。
现在我们再看 Lite-On 的 1.2MW Power Rack,就更能感受到行业正在往哪里走。这个 Power Rack 可以说是专为 GB300、未来 GB400 甚至下一代 AI 服务器打造的基础设施。它由 16 套 100kW 的 800VDC shelf 组合而成,通过 4-to-make-3 的冗余方式实现 1.2MW 输出,内置智能化监控、在线升级、安全防护、800VDC 触点绝缘等,很明显,它不是“更大号的电源”,而是完整的电力系统单元——未来机房就是用这一类模块堆出来的。随着 GPU 发展从单机到整柜,从整柜到整列,电源也在同步从 in-server → in-rack → sidecar 迈进。
Lite-On 是目前少数能同时服务三代 GPU 架构(Hopper、Blackwell、下一代)的电源公司,这意味着它的产品不仅跟得上时代,还提前和 NVIDIA、云厂的电力趋势对齐。
更大的趋势也越来越清晰:算力继续涨、GPU 功耗继续涨,机柜功率逼近 1MW,液冷成为标配,电力架构从 AC 转向 DC,从低压走向高压,从分散式供电变成集中式模块化。我们可以这样理解未来的数据中心:服务器不再考虑“自己带电源”,而是完全依赖旁边的高压直流电力机柜;50V 将继续存在,但只在机架侧做最后一步降压;800VDC 会成为机房内部的主流电压;而更远的未来,可能是用固态变压器(SST)直接把中压电网变成 DC,整个数据中心不再使用交流。站在这个趋势下再看 Lite-On 的路线,你会发现它基本踩准了每一个关键节点:机内电源、机架电源、800VDC shelf、1.2MW 侧挂、GPU 动态负载平滑……这些都是 AI 集群时代真正的基础能力。
说到底,电源从来不是“配角”,只是以前大家没太关注。现在,在 AI 训练规模拉到极限的时代,电力系统正在变成整个基础设施升级的核心变量。Lite-On 的这套 GPU 电力解决方案,实际上代表的是一种更长期、更深层的趋势——未来 AI 数据中心,不只是在堆 GPU,更是在堆电力与冷却架构,这是下一代算力时代的真正底座。

作者:极客石头

在搞事情的路上越走越远。

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注