
数据中心供电革命:从UPS到800V HVDC,影响几何?
|
随着生成式AI技术如GPT、Deepseek的飞速发展,AI行业正快速迈向技术突破的新阶段。全球科技巨头纷纷加大在大型数据中心的投入,旨在满足日益增长的算力需求,这不仅推动了数据中心的规模扩张,也带动了整个产业链的升级革新。
在此背景下,数据中心的电源系统作为关键支撑,正遭遇前所未有的挑战。2025年5月,英伟达宣布自2027年起率先推动机架电源从54V直流向800V高压直流(HVDC)转变,引发行业高度关注。本文将梳理数据中心供电架构的演进历程,并探讨800V HVDC架构对功率产品等上游元器件的影响。
早期数据中心的供配电架构多采用传统的UPS(不间断电源)方案,主要结构由整流AC-DC、逆变DC-AC和静态旁路(见下图ECO,即通过旁路供电)等部分组成。市电引入后,经变压器进行一次分配后,再通过UPS进行二级配电。
在正常情况下,输入的交流电经过整流和逆变后,既为负载供电,也同时对挂接在DC母线上的蓄电池进行浮充电。当输入交流电中断时,蓄电池会自动切换至放电状态,通过逆变器继续向负载供电,从而确保负载的供电不受中断影响。
而在机架内部,每个服务器刀片的通用冗余电源会将交流电整流并降压至12伏,为服务器主板提供输入电压。
为保障可靠性,传统数据中心常采用N+1、2N、DR、RR等供电架构。但这类架构冗余环节多、系统复杂,效率较低。例如,典型2N冗余设计的UPS系统全链路效率仅93%左右,意味着每支持1MW的AI算力就需要额外消耗70kW电力。
几十年来,这种架构一直是数据中心供电的行业标准,如今很大一部分系统仍采用这种配置。在这种架构中,一个典型的服务器机架支持的功率范围为10KW至15KW。
但随着巨型云数据中心的兴起,促使功率水平不断提高,从而催生了新一代的供电架构。2013年,在绿色互联网数据中心峰会,谷歌展示了当时其最新的48V机柜和UPS,服务器主板直接支持48V,并直接从48V降压到CPU的POL(负载点),减少了12V中间转换环节,效率更高,成本更低。
该供电架构实现了从电网到48V再到CPU的极致精简架构,去掉了机房级UPS,去掉了机柜级48V到12V的二次转换,而在服务器主板级实现了48V到CPU的单级变换。
与传统的UPS方案有几个不同:服务器电源电压增加到48V,同时将电源整合到电源架中,也称为“开放式机架”电源,且机架中还集成了本地备用电池单元。
2016年,谷歌在OCP峰会上宣布与OCP合作,并贡献了其48V整机柜架构及规格给OCP联盟。
图:谷歌48V机柜布局,来源:OCP 2016峰会
比起传统的12V服务器架构降低了30%以上的能耗,大大降低了全球云数据中心的能耗,且采用定制的48V供电POL服务器,所有服务器供电均来自整机柜后侧的48V母线排,可支撑单机柜功率密度达到30KW以上。
2019年,阿里巴巴在数据中心标准峰会上,携手台达、中恒电气推出全新互联网数据中心供电方案—数据中心巴拿马电源。巴拿马电源颠覆了传统IDC供电架构,将电路和磁路融合创新,从中压10KV AC直转240V DC(或336V DC),取代了传统架构从中压引入到直流输出之间的众多中间设备,让供电传输一步到位,更加高效和可靠。
图:阿里巴巴数据中心巴拿马电源,来源:国信证券研究所
巴拿马电源的功率模块的效率高达98.5%,架构简洁可靠性高,可确保供电系统五年不间断运行。相比传统数据中心的供电方案,其设备和工程施工量可节省40%,占地面积减少50%。
值得一提的是,因为巴拿马电源模式是定制化方案而非行业通用标准,目前除阿里外尚未大规模部署。
然而,随着AI数据中心的功率需求快速攀升,单机架能耗正从100kW攀升至超过1MW,使得48V/54V直流供电模式的局限性日益凸显:
空间桎梏:以英伟达GB300系统为例,8个电源架占据64U机架空间,导致计算卡安装空间严重压缩。而800V系统可在单个Kyber机架内为576块Rubin Ultra GPU供电,空间利用率提升超80%。
铜缆负重:1MW机架使用54V供电需200kg铜缆,若扩展至1GW数据中心,铜缆用量将达50万吨,成本与重量均不可持续。800V架构可使铜缆用量锐减70%以上。
效率损耗:54V系统需经历多次AC/DC转换,转换效率低且故障点多。800V方案通过工业级整流器直接将8kV电网输入转为800V直流,减少中间环节,端到端能效提升5%,同时降低散热压力。
2025年5月,英伟达宣布从2027年起,率先推动数据中心机架电源从传统的54V直流向800V高压直流(HVDC)过渡,以支撑单机架功率超1MW的下一代AI数据中心。
图:数据中心48V架构与800V架构对比,来源:纳微半导体
相较现有的48V/54V分布式供电方案,英伟达的800V HVDC系统最大的不同在于采用固态变压器(SST)替代传统工频变压器,实现了13.8kV交流向800V直流的转换,然后用高压DC-DC转换器取代服务器电源PSU,省去大部分中间转换步骤,最大限度地减少了电能损失和用铜量,在系统能效提升5%的同时,还可以将系统总拥有成本降低30%。
从上述发展历程来看,数据中心供电方案整体呈现出直流化、高压化和高密度化的演进趋势。
800V HVDC供电架构最直接的影响,是推动功率器件向着高压化与高频化方向升级。在集中整流环节,尤其是关键的固态变压器(SST)中,需要使用耐压等级达2300V至6500V甚至更高的SiC MOSFET。与传统的硅基IGBT相比,SiC器件在高压高频工况下的开关损耗可降低一个数量级,这为整个供电链路实现端到端效率提升约5%的目标奠定了坚实基础。
而在机架内部的DC/DC转换阶段,为追求更高的功率密度,开关频率需向兆赫兹(MHz)级别迈进,GaN器件凭借其优异的快速开关特性,成为这一场景的理想选择。例如在800V输入条件下,每个半波开关周期内其驱动损耗和开关损耗均显著低于SiC方案。这也意味着,SiC与GaN为代表的第三代半导体已从备选方案转变为必然选择,传统硅基超结MOSFET和IGBT的市场空间将受到挤压。
与此同时,800V HVDC供电架构的落地不仅考验器件本身的性能,也对支撑技术链提出了新的课题。中高压SiC器件(如3300V以上等级)的引入带来了信号隔离方面的挑战。根据安规标准,隔离芯片的最高瞬时耐压通常要求达到开关器件耐压的3-5倍,这意味着3300V-6500V的隔离芯片的安全耐压需达到10kV以上,10kV的SiC MOSFET栅极驱动器的隔离电压要超过20kV以上。其次,10kV SiC MOSFET的导通dv/dt可以达到100V/ns。因此隔离芯片亟需提高共模瞬态抗扰度(CMTI)性能,而传统的光耦、磁耦或容耦隔离技术难以在耐压与响应速度上同时满足要求,因此亟待发展新一代隔离解决方案。
在此背景下,市场预计AI数据中心供电架构的变革将重塑相关产业链的市场格局,为已提前布局SiC/GaN技术的功率半导体企业(如英飞凌、安森美、纳微半导体、英诺赛科等)以及在电源管理、磁性元件和液冷散热等相关领域的供应商创造了新一轮增长机遇,推动形成从半导体材料、器件制造到系统集成的全新产业生态体系。
从传统UPS到48V DC,再到800V HVDC,数据中心供电架构的演进史本质上是一场追求极致效率与功率密度的技术进化。800V HVDC供电架构不仅是对电压等级的提升,更是对数据中心“电力心脏”的全面重塑。它迫使功率器件向更高耐压、更高频率升级,同时驱动了从隔离驱动到散热管理的整个技术链协同进化。最终,这场变革将超越单纯的能效提升,深刻重塑相关半导体产业竞争格局。
版权声明:本文为四方维原创内容,著作权归四方维所有。未经四方维书面授权,不得以任何方式加以使用。