人工智能的快速发展正在重塑现代数据中心的设计。虽然讨论的焦点通常集中在GPU、液冷和计算性能上,但电力基础设施正成为同样重要的创新领域。
随着人工智能集群规模和功耗的持续增长,传统的电源架构正面临新的挑战。为了支持更高的功率密度并提高整体效率,许多行业专家正在评估直流配电在下一代人工智能基础设施中日益重要的作用。
现代人工智能训练和推理环境比传统企业计算系统消耗的电量要多得多。
高密度人工智能机架可集成:
随着机架功率需求不断增加,运营商正在寻求更高效的方式来输送、管理和保护整个基础设施中的电力。
人工智能工厂、大规模 GPU 集群和机架级计算架构的出现,使得机架功率水平远远超出了传统企业数据中心的设计,有些部署的机架功率已经超过 100kW。
传统数据中心严重依赖多个交流转直流和直流转交流转换阶段。
虽然这些架构已经为行业发展提供了几十年的支持,但不断提高的功率密度凸显了其一些局限性:
随着人工智能部署规模的扩大,即使是微小的效率提升也能转化为可观的运营和能源节省。
这促使运营商探索其他方法,以简化电力路径,同时提高整体系统性能。
现代人工智能基础设施最显著的趋势之一是向机架级电源架构的转变。
近期人工智能基础设施设计越来越多地采用机架级电源架和本地化电源转换方法,使电源管理更靠近计算资源,并降低配电复杂性。
运营商不再仅仅依赖传统的交流配电,而是越来越多地评估基于直流的方法,这些方法可以减少某些转换阶段,并在高密度计算环境中提高效率。
潜在益处包括:
随着机架功率的不断增加,直流配电在基础设施规划讨论中正变得越来越重要。
另一个重要趋势是人工智能基础设施与储能系统之间日益紧密的联系。
为了提高韧性和运营连续性,许多设施正在扩大以下方面的使用:
随着电池储能系统、电池备用单元 (BBU) 和先进的 UPS 平台在人工智能设施中不断扩展,直流电源架构作为简化集成和减少不必要的转换步骤的一种手段,正受到人们的重新关注。
这一趋势正在加强数据中心行业与传统上与电池储能系统相关的技术之间的联系。
更高的功率水平意味着更大的故障管理和系统保护责任。
与传统环境不同,高密度人工智能基础设施可能会将大量的电力负荷集中在相对较小的物理空间内。
因此,设计师必须仔细评估:
随着运营商寻求在可靠性、安全性和系统可用性之间取得平衡,保护协调正成为基础设施设计中越来越重要的组成部分。
随着直流架构的日益普及,有效的故障保护变得越来越重要。
电池系统、直流配电网络、电源转换设备和机架级电源系统都需要可靠的保护措施来应对异常运行条件。
直流熔断器继续发挥着重要作用,它有助于在过大的故障电流损坏敏感设备或影响更广泛的基础设施运行之前将其中断。
随着系统容量的增加,保护性能成为维持长期可靠性的关键考虑因素。
除了故障保护之外,可靠的开关和隔离功能也正在成为现代人工智能电源架构的重要组成部分。
随着电池备用系统和直流配电网络的日益普及,基础设施运营商需要可靠的方法来:
在电池后备电源系统、储能集成平台和某些直流配电架构中,直流接触器越来越多地用于支持开关、隔离和安全功能。
可靠的交换性能有助于保障运营连续性和基础设施安全。
人工智能基础设施的未来需要的不仅仅是先进的处理器和精密的冷却技术。
可靠的电源供应、高效的能源管理和有效的保护策略都将在支持下一代计算环境中发挥关键作用。
虽然未来的电力架构可能会因设施和部署模型而异,但直流配电技术预计将在围绕效率、电池集成和高密度人工智能基础设施的讨论中发挥越来越重要的作用。
对于系统设计人员、运营商和设备制造商而言,重点不再仅仅是提供更强大的计算能力。他们的目标是构建能够支持人工智能计算长期发展的、具有弹性、高效且可扩展的基础设施。
+86 28 86519933