如何避免冗余电源引起数据中心故障

时间:2009-01-15 08:36来源:世纪电源网

摘要:为服务器配置双重电源以提高可靠性是目前重要任务数据中心环境的通常做法。然而,如果使用得不正确,这种做法可能会提高电源故障的风险。一个第四级数据中心应用将包括两个完全独立的电源线路,每一个线路包括六个基本的电源组件:1.公用电源和主电源板2.备份发电机和自动传输交换机3.不...

  为服务器配置双重电源以提高可靠性是目前重要任务数据中心环境的通常做法。然而,如果使用得不正确,这种做法可能会提高电源故障的风险。一个第四级数据中心应用将包括两个完全独立的电源线路,每一个线路包括六个基本的电源组件:

  1.公用电源和主电源板

  2.备份发电机和自动传输交换机

  3.不间断电源和维护旁路板

  4.配电单元(或者不间断电源的子板)

  5.机架级配电单元

  6.服务器内部电源

  每一个线路和在这个线路中的每一个组件必须能够支持整个数据中心的100%的工作量。这是真正的2N冗余。也就是说没有任何一个单点故障能够中断数据中心设备的运行(见图1)。

  如何避免冗余电源引起数据中心故障(图)

  图1.一个第四级全面冗余的数据中心

  当然,并非每一个数据中心都是第四级的设施。所有额度操作人员都喜欢拥有全套的电源系统冗余。但是,成本问题迫使人们做出取舍。这就意味着虽然服务器有双电源,但是,这两个电源线路的其余部分不是完全独立的(见图2)。最常见的情况是这个服务器的每一个电源线路都插入到不同的机架级配电单元中。这种情况给大多数管理员创造了一种冗余的感觉。实际上,隐藏的电源问题就从这里开始了。

  如何避免冗余电源引起数据中心故障(图)

  图2.电源线路故障的单个点

  这种表明上简单和普通的做法是数据中心电源故障的潜在原因(见图3)。在大多数情况下,当这两个电源都工作时,这种双电源将按照大约各占50%的比例共同承担服务器的工作量。然而,如果其中任何一个电源发生故障或者失去输入功率,剩余的电源必须能够提供100%的电源需求。

  如何避免冗余电源引起数据中心故障(图)

  图3.通过冗余的配电单元能够实现更好的可靠性

  服务器通常是采用可用的两个机架级配电单元安装和运行的。每一个电源线路仅提供服务器电源需求的50%的电源。一般来说,这个配电单元的工作负荷一般都低于保护它的电路保护器的跳闸值。事实上,即使这个配电单元有一个电流表,大多数管理员都会认为如果他们只有60%的电源水平的话他们就有容量增加更多的服务器(见图4)。

  如何避免冗余电源引起数据中心故障(图)

  图4.如果一个配电单元发生故障,其余的配电单元也将过载

  这种想法会导致典型的串联电源故障。如果一台额外的服务器或者其它设备超过了配电单元的负荷,超过了两个配电单元中任何一个配电单元的跳闸点,也会导致同样的问题。

  安全地采用双服务器电源和双机架配电单元的唯一方法是保持工作负荷在机架配电单元或者线路的表面额定值的40%以下。此外,所有的电路必须在一个电路保护器的保护之下。UL(美国保险商实验室)和NEMA(美国电器制造商协会)的强制标准禁止使用额定值的80%(见图5)。在一个双配电单元的机架中,整个设备的负荷不应该超过16A。因此,为了避免潜在的并联过载和导致整个机架电源故障,每一个配电单元一般仅提供8A的负荷。

  如何避免冗余电源引起数据中心故障(图)

  图5.安装不良的双配电单元在故障时提供冗余

  在一个多项配电电源中,这是更加重要的,因为常见的情况是使用一个三项208/120伏配电单元。这个配电单元有三组单项120伏输出接口,一个三项保护器为其提供电源。在这种情况下,如果任何一项电源超过了额定的电流,这个保护器就会跳闸,所有这三项电源都会中断,从而导致整个机架断电(见图6)。

  如何避免冗余电源引起数据中心故障(图)

  图6.典型的三项配电单元电路保护

  正如早些时候指出的那样,即使这些管理员拥有配置仪表的配电单元,他们没有认识到一旦他们超过40%的电源负荷,他们就有出现并联电源故障的危险。而且,随着服务器的一直升级和增加,很容易看到这种情况在没有警告的情况不断增加,一直到发生故障为止。每一个有关人员都对电源故障感到困惑,因为每一个人都认为他们有“冗余的”电源。

  数据中心的拥有者和操作者应该评估每一个配电单元的机架级电流吸收量。这也许需要升级到有仪表的配电单元。远程监视(通过SNMP和/或 者网络)能够通过向管理软件发送SNMP陷阱减少人工监视几十个或者数百个配电单元的时间和成本。此外,这个极限(也就是75%)应该设置在监视软件中,向管理员发送自动的报警,在超过电路负荷之前警告管理员可能出现电源问题。

  在任何情况下,真正的冗余都要求两个电路中的任何一个电路在其它电路发生故障的时候都能够持续提供100%的电源负荷。评估和详细记录现有的负荷结构并且预防性地监视和管理所有配电单元的负荷水平以及电源线路中所有的其它组成部分是非常重要的。改变配电单元会包括一些关机时间。然而,同任何电源线路网络一样,如果没有真正的2N电源线路,关机时间也许是必要的。这个选择似乎是很明确的,有一些计划之中的有限的关机时间或者没有计划的意料之外的关机。

http://www.21dianyuan.com/supply/supplyhome/company.php?company_id=1544

免责声明:本文若是转载新闻稿,转载此文目的是在于传递更多的信息,版权归原作者所有。文章所用文字、图片、视频等素材如涉及作品版权问题,请联系本网编辑予以删除。
我要投稿
近期活动
帖子推荐更多

Copyright 2008-2024 21dianyuan.com All Rights Reserved 备案许可证号为:津ICP备10002348号-2