数据中心大火波及360万网站,UPS安全性可靠性亟需关注

时间:2021-03-23 18:56来源:

摘要:2020年,数据中国新建设被中央正式列入新基建战略。新基建浪潮的推动加之疫情下数字经济的高速发展催生对数据中心的新需求,作为新基建的基

2020年,数据中国新建设被中央正式列入新基建战略。
新基建浪潮的推动加之疫情下数字经济的高速发展催生对数据中心的新需求,作为新基建的基础设施,数据中心迎来更大的发展机遇。各地纷纷部署数据中心建设,各互联网巨头也竞相布局。
以5G、大数据、物联网、人工智能等新技术、新应用为代表的新基建,在推进疫情防控和疫情后经济复苏上发挥了巨大作用,成为适应经济发展趋势、推进社会稳定发展的重要引擎。
数据是贯穿新基建的生命线,数据中心是新基建有序运行的基础保障,被视为“新基建的基础设施”、经济高质量发展的“数字底座”。
相关单位预测,2025年全球数据流量将会从2016年的16ZB上升至163ZB,带动数据中心总体建设规模的持续高速增长。
随着"新基建"浪潮的不断推进,各行业的数字化转型已成必然趋势.在此背景下,作为承载数据和计算的数据中心面临能耗高,可靠性和安全性以及运维复杂等巨大挑战,亟待变革.
2021年3月10日,欧洲云计算巨头OVH其位于法国斯特拉斯堡的机房发生严重火灾。在OVH在全球拥有27个数据中心,其中15个位于欧洲。
OVH迅速的做出了整个事件的应对计划,但火灾造成的损失已经难以避免,其托管的许多网站中的数据或永久丢失,包括巴黎议室中心额图书馆等多家公司的数据恐难以恢复;

图片1现场图片
至于火灾原因,目前还没有正式公布,但多种事实指向了UPS设备导致的一系列故障;
3月12好,OVHcloud创始人OctaveKlaba在Twitter上发布了一个8分钟的视频,视频中称当消防员到达时,热像仪检测到SBG2数据中心的UPS7号和UPS8号正在燃烧;他还提到,在火灾发生的前一天,供应商对UPS7号进行了维护,Klaba称供应商在UPS7号内部更换了某些部件,并在下午重新启动。
 

图片2现场图片
此次火灾不禁让人回想起伦敦最大数据中心的故障,2020年9月,伦敦最大数据中心发生故障,该事件是由UPS系统故障引起,并在随后火灾警报,该警报关闭了Equinix的LD8数据中心,同时还还影响了其它客户的网络服务。据了解,该数据中心在2016年7月20日上午曾由于UPS电源系统故障,导致连接其数据中心的英国各地的互联网中断,整个伦敦有10%的使用互联网服务的客户由于电源故障而受到影响。
虽然目前OVH并没有最终公布此次起火的原因是由于UPS引起,但由于UPS在数据中心的独特的地位使得它成为历次数据中心重大事故起因重点嫌疑对象。
在当今现代社会的各个行业的竞争日趋激烈的形势下,虽然数据中心客户追求高性价比、高投入产出比无可厚非,但是人们看重效益的同时往往忽略或淡化了UPS最为重要的设计特性,即高可靠性和高安全性,这为数据中心生产带来了非常可怕的潜在隐患,它的后果是惨痛的、代价是高昂的。
Eaton作为业界领先的UPS设计制造商,UPS的安全性,可靠性是我们一贯的坚持和承诺;
Eaton与全球重要数据中心都有保持长期的合作关系,此次发生故障的欧洲云计算巨头OVH和伦敦最大数据中心都有使用Eaton 9395系列和93PM系列UPS,在此次事件中正常运行,保持一贯的长期的安全可靠的稳定的运行。
不可否认,UPS的特殊结构和工作原理也使得它成为数据中心火灾发生的一个重要因素之一。这些重大的灾难性事故为我们再次敲响了警钟,高可靠性、高安全性是UPS设备本身存在的一个最为基本的要素,是不能被忽视的。
从UPS工作原理看,UPS引起的起火及断电事件中,多数原因是由于UPS自身设计标准,绝缘距离,关键器件的可靠性,散热系统,UPS电气结构及UPS厂家技术设计能力等引起;
我们以EatonUPS设计为例,从以上几个方面一一细述如何实现UPS的可靠性和安全性:
EatonUPS安全性,可靠性设计:
  1. 设计标准和原则
  2. 作为UPS设计制造全球领先的公司,UPS设计需要满足中美欧等全球市场对于安全和可靠性的要求,Eaton9395和93P等系列UPS在全球市场同步销售,需要同时满足400V系统和480V系统安全和可靠性设计要求,所以在绝缘间距和线缆选择上是以最严苛的标准来设计。
  3. 一直秉承严格要求,坚持全球化高标准的设计,为全球数据中心等行业提供安全可靠的UPS产品,提供可靠的电能质量的保证,助力行业发展。
  4. 高可靠性元器件使用
  5. 内部产生积热在所难免,长期运行下,对内部器件产生影响也在所难免,所以UPS内部器件的选择就显得极为重要;特别是与UPS安全性和可靠性相关的关键性器件的选择,需要从设计,材料和厂家资质等方面严格筛选。
  6. 以上机型均采用国际知名厂商IGBT模块设计,相比分立元件有以下优点:
  • 抗冲击能力强,
  • 不存在内部单管并联均流问题
  • 温度均匀,散热好
同时对于对温度特别敏感,同时与UPS安全性,可靠性设计息息相关的滤波电容器件,EatonUPS全部导入油浸式电容,替代薄膜电容,杜绝因为材料缺陷而引起的电容冒烟,起火等严重事件的发生。
油浸式电容相比薄膜电容有如下优点:
  • 油浸式电容,高电压,高电流,高频率
  • 高可靠性,IEC61071/UL810认证- 通过严酷双85C 2000小时测试 (85℃/85%RH)
  • “内置安全分断设计”,在电容容值异常时自动断开, 失效安全,没有冒烟或起火风险
  • 长寿命,额定负载10年以上

 
   
高可靠性油浸式电容,及其防护装置和预防性告警高可靠性器件的选择,保证了UPS能够在正常情况下的稳定运行,但现场存在各种难以预见的极端条件,EatonUPS增加了电容的防护装置和预防性失效预警电容侦测,进一步提升关键部件的寿命,降低 UPS 故障发生的可能性,保证对负载设备的可靠保护;

 

 
  1. 智能风冷调速系统,长寿命设计
  2. 内部产生的热量长时间积累下会对内部元器件产生不可逆的影响;
智能风冷调速系统可以快速排出UPS内部产生热量,减少积热,减少对热敏感元器件的影响,进一步提升UPS系统的可靠性和寿命:
  • 关键元器件电容更换周期10年@ 40C
  • 优化风道设计
电解电容位于进风口, 低温度环境和长寿命;
只有散热器和电感通过热风,其余器件(电容和温度敏感器件)处于低温风道。
 
  • 模块化UPS系列智能风冷调速系统:

 
Eaton可扩展模块化系列UPS智能风冷调速系统:
  • 前进风、上出风
  • 避免将机房地板下的灰尘抽入 UPS 机内
  • 尤其在工业环境中,可有效避免灰尘沿冷却通道进入 UPS 内部的电路板、造成短路
  • 独特的系统设计,热量较大的功率模块在顶部,功率模块的热量不会影响内部其它器件和线缆,避免功率模块故障引起更多损坏;

 
   

5冗余设计高可靠器件的选择,智能风冷调速系统等从器件和结构方面保证了UPS的安全可靠性,但作为系统散热的核心部件风扇及其供电的可靠性很大程度上影响了UPS的安全性和可靠性;UPS运行产生损耗,损耗所产生的热量需要风扇持续快速的强制排出,
  • 可扩展模块化系列UPS,功率模块,电源板及其取电方式均采用冗余设计,内部模块化架构支持电源模块 N+X 冗余,减少断电风险;
冷却风扇及风扇电源的冗余设计:
  • 风扇是 UPS 的关键易损部件,风扇的损坏会导致 UPS 内部工作温度飙升至保护性宕机,严重情况下会引起明火;
  • 冗余、在线可更换、潜在故障报警等功能可以有效降低或避免此类故障的发生
 
  1. 故障紧急转旁路设计
以上的设计及选型,最大程度上保证了UPS的安全性和可靠性,但UPS为数据中心提供可靠稳定的供电保障,当UPS产生故障时,UPS供电需要紧急转至旁路,为系统提供最后一道保护屏障,保证系统持续稳定运行,不至于因UPS设备硬件故障而造成用户系统宕机、重要数据丢失等无法挽回的重大损失。
所以UPS故障紧急转旁路的设计及表现同样极为重要。
 

 
   

以下对比了EatonUPS和友商某EXL系列UPS紧急转旁路转换时间:
 

 
  1. 损耗密度
电力电子技术的发展趋势是高功率密度,但盲目的追求高功率密度是以牺牲散热面积和绝缘间距为代价的,所以UPS的设计和选型中,不能盲目的追求高功率密度和低占地面积,安全性和可靠性因该为首要考虑因素。
为更好的阐述和理解UPS安全性和可靠性,我们首先提出一个热损耗密度的概念。
为了更好的表征UPS损耗对UPS散热能力等影响,Eaton提出了损耗密度的概念,即单位体积内所产生或承受的损耗功率;与功率密度不同的是,功率密度表征单位体积能传输的能量,而损耗密度表征的是单位体积消耗掉的能量;
损耗密度可以从安全性和可靠性方面为大家在选型UPS的时候提供另一个角度,同时这也是很多UPS起火的秘密所在—盲目的高功率密度产生高损耗密度,高损耗密度导致积热严重,使得在某些特殊情况下导致UPS损坏,掉载,甚至起火。
我们选取同行业600kUPS为例作为选型对比,数据均来自官网:
  • 损耗密度
  •  
厂商
  1.  
效率 体积(mm^3) 损耗密度w/mm^3
  1.  
  •  
  1.  
  1.  
  1.  
7.69231E-06
  1.  
  •  
Galaxy 3L600kVA
  1.  
  1.  
1.28994E-05
  1.  
  •  
Xpert 9395 600kVA
  1.  
  1.  
6.90799E-06
 
从以上数据可以看出,EatonUPS损耗密度是最小的,在同样都是风冷散热的条件下,损耗密度越小,由损耗产生的积热而产生的安全性和可靠性的隐患越小。
 
 
EatonPower Xpert 9395系列可扩展模块化系列UPS积累了伊顿50年UPS开发设计和先进制造经验,当前全球装机容量超过10GVA为全球第一大型UPS品牌,其安全性和可靠性在以下多个行业领域中得到了广泛应用和验证:
  • 大型数据中心
  • 大型基础设施项目
  • 金融及银行业
  • 各种大中型工业领域
  • 医疗保健行业
  • 自动控制领域
  • 电信通讯行业
 
伊顿产品采用全球化的质量管理体系,严格管理设计,材料,组装等关键环节和工艺,具备高稳定性,高可靠性的供电系统。
同时伊顿具备优秀的 UPS 运维服务能力,能最大化减少故障发生,缩短故障处理及设备更换的时长,降低对数据和数据业务的影响,并能有效控制机房的运维成本。
 
目前,在国家政策和巨大需求的推动下,我国数据中心掀起了新一轮的建设高潮。数据中心投资连续多年保持高速增长,数据中心规模逐渐扩大。在数据中心增长过程中,数据中心的安全问题,能耗问题逐步凸显。数据中心供电系统的稳定性,直接影响数据中心IT设备的稳定运行,决定着数据中心的安全和服务能力。UPS作为数据中心供电系统的核心,发挥着关键作用。
 
从功率段结构来看,近年来中国UPS市场功率段进一步向大功率迁移,100kVA以上的产品占比进一步扩大,200kVA以上的产品继续保持迅猛的增长势头。
在保证安全性和可靠性的前提下,大功率UPS设计的复杂度和难度不可同日而语。
 
同时数据中心设备众多功率大耗电量大;机房线缆多,布线复杂,电气火灾串火快,危害极大;要从根本上避免起火事件,需要从源头上杜绝此类事件发生,提高对UPS的安全性,可靠性等方面的认识就显得极为重要,对机房设施安全的重要性需要给予足够的重视。特别是当前UPS市场上大功率的UPS品牌和型号众多,功能特点不尽相同,这为客户的UPS选型带来一定的困扰,但无论选择功能特点、性能参数的UPS,可靠性和安全性的设计一定是需要首先考虑的因素,不能妥协。
 
伊顿UPS坚持一贯的安全性和可靠性设计,从多层次,多方面的安全性和可靠性研究和设计,杜绝UPS自身安全性和可靠性隐患而产生的对数据中心等行业领域稳定运行的影响,助力中国UPS行业成长,助力中国新基建建设。

免责声明:本文若是转载新闻稿,转载此文目的是在于传递更多的信息,版权归原作者所有。文章所用文字、图片、视频等素材如涉及作品版权问题,请联系本网编辑予以删除。
我要投稿
近期活动
帖子推荐更多

Copyright 2008-2024 21dianyuan.com All Rights Reserved 备案许可证号为:津ICP备10002348号-2