电源管理总线(Power Management Bus,简称PMBus)是一项已为人熟知的技术,它定义了用于电源和系统的数字化监控和控制规范。基于开放标准协议,PMBus灵活而功能齐全,能够实现各种设备之间的通信。
不过,符合PMBus标准并不保证电源设备或系统的可靠性。
相反,设计工程师仍需了解PMBus的能力,确保他们的电源设备或系统能够利用PMBus提供的数据。
PMBus是一种标准通信格式。当前有些行业委员会正致力于制定该标准以及其他电源应用相关的标准化工作,但该标准仍存在许多未定义的方面,使其无法覆盖新的应用和用例。这意味着工程师们必须具备相应的设计经验、对系统功能的理解以及推进结构化执行和测试的能力。
PMBus定义的领域以及局限性
PMBus基于集成电路总线(Inter-Integrated Circuit,简称I²C)和系统管理总线(System Management Bus,简称SMBus)协议。它定义了两个不同领域:
· 通信链路的物理和电气实施方案
· 可用于通信的标准命令集
除此之外,PMBus没有规定电源系统架构、外形尺寸或要使用的组件。总线的最大运行速度为1 MHz,但并未规定数据采集的采样率。
PMBus有许多标准命令,其中包括读取遥测数据的命令,如输出电压和电流(READ_VOUT、READ_IOUT)和温度(READ_TEMPERATURE_1)。它的标准命令集还包括用于控制设备的命令,如远程关机和启动。供应商可以自定义这些命令并定制其专属的命令。
获取可靠数据
设计师们需要注意,PMBus的数据完整性依赖于电平信号(Transistor-Transistor-Logic,简称TTL)信号发送的数据包,因此高噪声水平可能会破坏数据。为了保证数据完整性,PMBus支持数据包错误校验(packet error checking,简称PEC)。
除了使用PEC之外,PMBus系统还应该验证地址并监控SMBALERT #信号,该信号使目标设备能够将故障情况通知给控制器。PMBus系统还应能够处理时钟延展,即允许目标节点将时钟信号保持在低电平,以获得更多时间来处理数据。
采集数据时,电源系统应使用合适的采样率。这可能包括在瞬态和事件发生时使用的快速采样率(10–50 Hz),以及在观测长期漂移时使用的慢速采样率(0.1–1 Hz)。
将遥测数据映射到实际故障模式
PMBus可以提供多种有用的数据,但我们需要准确了解PMBus的哪些值预示电源的哪些性能退化。
下表列出了电源中四种最重要的故障模式和识别该故障的典型表现。该表还详细列出了可以监测的PMBus信号,用于判断是否出现这些症状,以便及早发现潜在问题并进行预防性维护。
为了充分利用采集的数据并可靠地检测异常情况,设计师们可以使用滚动基线法。这包括为每个信号计算指数加权移动平均值(Exponentially Weighted Moving Average,简称EWMA)和方差(Exponentially Weighted Variance,简称EWVAR),并在可能的情况下按环境温度进行归一化处理。
设计师们可以定义合适的软限值和硬限值,以及相应的操作。例如,EWMA的微小变化可能只会生成一个服务单或警报,更严重的变化则可能立即触发停机。系统必须具备语境感知能力,来避免发生已知事件(例如计划内的风扇曲线变化)时发出不必要的警报。
故障前自动缓解
一旦识别出异常情况,就需要通过PMBus将其转化为相应的操作,例如:
· 如果热耗裕量较低,系统可以增加并联电源轨上的相位扩展(使用供应商的MFR_PHASE),并暂时降低最大负载(使用IOUT_OC_WARN_LIMIT或功率限制)。
· 如果连接器损耗增加,系统可以通过使用TON_DELAY/TOFF_DELAY错开电源轨来调整时序,降低同时发生的浪涌电流。系统还可以在保持系统运行的同时触发维护窗口。
· 如果怀疑系统运行不稳定,系统可以在支持的情况下微调补偿参数(使用供应商的MFR_COMP_*),在受控窗口内进行测试,然后将结果存储到非易失性存储器(non-volatile memory,简称NVM)中。
结论
PMBus可以作为预测性平台发挥重要作用,提供可操作的数据,实现预防性维护并提高可靠性。