农业银行股份有限公司山东省分行 山东 济南 250000
【摘要】数据中心机房所承载电子设备的安全运行历来是信息科技第一要务。随着电子设备制造工艺标准的改变,结合近年来国内部分地区空气质量恶化,机房内过量的气态污染物特别是硫化物对电子设备的腐蚀情况在加剧,电子设备的“带病”运行形成了重要风险隐患。本文以某省国有银行分行机房设备硫腐蚀综合治理工作为案例,阐述了设备硫腐蚀的成因和影响,并论证了治理对策的有效性,为业界中大型机房处理硫腐蚀问题提供了有力借鉴。
【关键词】:机房安全 设备硫腐蚀 综合治理
一、背景
处在周边严重污染环境中的数据中心机房经常会出现电子设备硬件故障的问题,原因在于无铅制造的有关规定直接改变了相关电子设备的制造工艺和构造,如欧盟的RoHS法令等,这些改变使电子设备更容易受到气态分子污染物的腐蚀。RoHS(ERA Technology)方面权威研究表明:使用无铅工艺的印刷线路板比使用锡/铅工艺的更容易被腐蚀。因此,气态污染物对机房电子设备的腐蚀问题需要引起高度关注。
二、硫腐蚀情况及影响
某省国有银行分行机房首次发现设备硫腐蚀问题是在2008年左右,当时该行使用的某知名IT公司存储设备硬盘故障率居高不下,该公司在把相关故障部件送到美国实验室检验后,确认故障设备电路板表面发生了硫腐蚀。
(一)硫腐蚀的定义和产生原因
1、定义
硫腐蚀在业内被称为“蠕变腐蚀”,是指导体受腐蚀产生的腐蚀生成物在电路板上蔓延的现象,这种情况会导致电子元器件的短路。因为在腐蚀生成物中发现了硫、氯、钙等元素,且硫的含量较多,所以更多使用“硫腐蚀”这个词。
2、产生原因
ERA Technology的可靠和失效性分析工作组已得出结论:电子设备失效是其与空气中的浓度较低的气态硫化物的相互作用所导致。传统的电子线路板制造工艺使用锡铅合金作为焊接材料,不容易发生腐蚀现象。随着无铅化法令的实施,电子设备制造业普遍采用“浸银”技术来替代传统工艺。在空气质量好的环境中,“浸银”技术处理的IT设备不会发生问题,但当空气中气态污染物较多时,特别是硫化氢、二氧化硫、氮氧化物等在一定的温度与湿度条件下的混合作用,硫腐蚀情况就出现了。
(二)硫腐蚀影响及污染源分析
1、硫腐蚀影响
硫腐蚀现象一旦出现,影响面会逐步扩大。该行对故障设备和在用设备检测后发现,最初仅存储和存储交换机有腐蚀现象,两年后,服务器、小型机、磁带库等设备的硬盘、电源模块和各类板卡等均不同程度的受到腐蚀。经统计,该行90%以上故障设备发现有硫腐蚀现象,对生产系统的潜在危害极大。
2、污染源分析
为查找硫污染源,该行邀请国家环境分析测试中心进行了3次机房空气质量检测,结果显示机房各区域空气中硫化物含量与该行大楼周边空气中含量差别不大,无法确认硫化物的具体来源。
为进一步查找污染源,该行先后请2家国际知名IT厂商共进行了5次硫腐蚀挂片监测(银片、铜片腐蚀程度变化)。监测结果(表一)显示,机房外部新风入口处的挂片腐蚀非常严重,为“数据中心环境污染级别”(表二)中的最高级,机房内绝大多数点位的挂片腐蚀级别也是最高或次高级,这说明进入中心机房的新风和机房内的空气都存在严重的问题,而进入机房的新风可能为罪魁祸首。
挂片点位 | 铜腐蚀情况 | 银腐蚀情况 | 腐蚀级别 | |||||||
Cu2S | Cu2O | Cu-Unk | Total | AgCl | Ag2S | Ag-Unk | Total | |||
机房A分区1 | 0 | 129 | 9 | 129 | 0 | 1,503 | 62 | 1,565 | G3 | |
机房A分区2 | 299 | 103 | 267 | 669 | 534 | 869 | 62 | 1,465 | G3 | |
机房A分区3 | 0 | 39 | 352 | 391 | 28 | 1,973 | 85 | 2,086 | GX | |
机房A分区4 | 164 | 86 | 371 | 621 | 477 | 4,381 | 166 | 5,024 | GX | |
机房A分区5 | 0 | 61 | 188 | 249 | 0 | 1,810 | 93 | 1,903 | G3 | |
机房A分区6 | 0 | 81 | 201 | 282 | 0 | 2,100 | 73 | 2,173 | GX | |
机房B分区 | 0 | 78 | 161 | 239 | 0 | 1,430 | 83 | 1,513 | G3 | |
机房C分区 | 0 | 55 | 121 | 178 | 0 | 543 | 52 | 595 | G2 | |
机房D分区 | 0 | 80 | 427 | 507 | 225 | 3,693 | 83 | 4,001 | GX | |
机房外新风入口 | 735 | 152 | 210 | 1,097 | 309 | 1,774 | 83 | 2,166 | GX | |
机房外新风入口对角 | 425 | 135 | 1130 | 1690 | 150 | 2129 | 57 | 2364 | GX |
关于污染严重级别的说明如下:
Table B-1 – 数据中心环境级别表 | ||
总的铜/银测试片腐蚀 | ||
级别 | 空气质量级别 | 腐蚀程度 |
GS* | 良性 | < 100Å / 30 天 |
G1 | 轻度污染 | < 300Å / 30 天 |
G2 | 中等污染 | < 1,000Å / 30 天 |
G3 | 严重污染 | < 2,000Å / 30 天 |
GX | 重度污染 | ≥ 2,000Å / 30 天 |
表二:数据中心环境污染级别
三、硫腐蚀治理对策
受制于该行所在城市区域和机房外部较差的空气质量状况,该行研究解决硫腐蚀问题的重点是改变机房内硫化物超标的情况,方法一是要对机房空气进行除硫净化治理,二是要保持机房正压和密闭,三是采取措施减缓气态污染物与设备电路板的化学反应速度。
(一)空气净化技术研究
为提供或保持合适的空气质量,运用适当级别和类型的空气过滤器可以有效地减少气态污染物特别是硫化物低于规定的水平,从而最大限度的减少设备故障率。业界大多数公司的空气过滤器采用一种或多种颗粒吸附介质,结合使用粉尘过滤器,已被证明可以有效的控制气态污染物(图一)。这套“组合系统”可同时实行粉尘和气态污染物的控制。
(二)空气净化除硫措施
减少机房内部的气态污染物,对机房空气进行除硫净化治理,一是要在空气进入机房前进行净化除硫处理,二是对已进入机房的空气再次进行除硫净化处理。
1、新风净化降硫措施
(1)新风口位置选择
外部新风口应选择通风良好、远离局部污染严重的位置,该行对新风口的位置进行了调整,延长原有新风管路(图二红色部分),使机房新风口的位置远离大楼厨房烟道出风口,避免了厨房排放的油烟废气经机房新风口进入机房。
(2)安装脱硫设备
在新风管道中间安装了空气脱硫设备(图二,DWPSA302),过滤去除外部空气中所含的粉尘和中等浓度含硫等成分的气态污染物,并给机房加压,使空气经过脱硫净化处理后再进入机房。
图二:新风脱硫设备安装位置
2、机房内空气净化措施
(1)安装净化设备。根据机房各分区面积大小和污染程度布设不同数量除硫设备,处理低到中等水平的气态污染物,使机房内部空气再循环得到进一步的净化处理;
(2)减少二次污染。为避免机房内部能吸附污染空气的设备设施形成污染源,减少二次污染,采取的措施一是更新精密空调过滤器,对精密空调蒸发盘管进行了清洗;二是对防静电地板的水泥充入孔和切割面采用自粘性锡箔纸进行了密封处理。
(三)机房密闭和负压治理
机房内部密封性不好,人员出入频率过高,通往外部的开口、线槽未封堵,以及墙面和屋顶的裂缝等都可能会导致污染的空气渗透进入。该行一是将机房对外的管道线槽、彩钢板隔断的缝隙、进出机房的各类开孔洞、进出机房的防火门进行了封堵和密封处理;二是有效治理机房负压,根据机房面积和人员数量配置相应功率的新风机组,保证形成机房正压的新风量。
(四)其它风险缓释措施
较高的温湿度是加速金属化学反应的催化剂,机房温度的可调整范围不大,为降低设备腐蚀速度,该行调低了精密空调和加湿机的设定湿度,将机房湿度控制在机房规范要求的下限。一方面申请专项资源,对腐蚀严重的核心生产存储及存储交换设备进行更换,降低了设备故障的风险系数。
四、硫腐蚀治理效果分析
(一)挂片监测分析
综合治理半年后,该行进行了硫腐蚀综合治理后的初次挂片监测,挂片监测检验结果良好(详见表三)。
位置 | 铜腐蚀情况 | 银腐蚀情况 | 腐蚀级别 | |||||||
Cu2S | Cu2O | Cu-Unk | Total | AgCl | Ag2S | Ag-Unk | Total | |||
机房A分区1 | 59 | 112 | 83 | 254 | 0 | 204 | 88 | 292 | G1 | |
机房A分区2 | 0 | 44 | 142 | 186 | 12 | 279 | 93 | 384 | G2 | |
机房A分区3 | 0 | 103 | 63 | 166 | 0 | 220 | 54 | 274 | G1 | |
机房A分区4 | 0 | 120 | 84 | 204 | 16 | 361 | 49 | 426 | G2 | |
机房A分区5 | 40 | 63 | 58 | 161 | 0 | 205 | 49 | 254 | G1 | |
机房A分区6 | 0 | 89 | 137 | 226 | 0 | 290 | 59 | 349 | G2 | |
机房B分区 | 0 | 104 | 95 | 199 | 0 | 177 | 39 | 216 | G1 | |
机房C分区 | 0 | 97 | 53 | 150 | 0 | 134 | 54 | 188 | G1 | |
机房D分区 | 0 | 59 | 158 | 217 | 0 | 246 | 39 | 285 | G1 | |
机房外原新风入口 | 497 | 83 | 3344 | 3924 | 158 | 2,261 | 68 | 2487 | GX |
对比表一的检验结果,机房内各监测点的腐蚀级别均有不同程度的下降(1-2个等级),机房内部空气质量有一定程度的改善,机房硫腐蚀治理项目已取得初步成效。但是,机房外部原新风口的监测腐蚀级别与上期检验结果相同,仍为最严重的GX级,具体检测数据比上期数据还要高,说明六楼平台空气质量仍未改善,A分区两个新风口挂片较其它位置挂片的腐蚀级别高(G2级)也能验证这一点。
(二)设备故障次数对比分析
治理前一年,该行机房电子设备的月均故障率为月均12.1次左右。实施治理后,设备故障情况总体保持下降趋势,近一年月均7.2次左右。设备故障次数的缓步下降有效验证了硫腐蚀综合治理的效果良好,机房内部空气质量逐步改善。
五、结束语
实施机房硫腐蚀治理工作是该行应对机房环境问题的重要探索,和解决数据中心机房硫腐蚀问题的首次尝试,为系统大中型机房硫腐蚀问题的处理和解决提供了有力借鉴。但硫腐蚀现象是设备和环境是两种因素造成的,解决硫腐蚀问题非一日之功,无法一蹴而就。对治理工作要持续监控,采取有效手段,加强后续跟进措施的落实,保障IT安全。
注释
ROHS:RoHS是由欧盟立法制定的一项强制性标准,全称是《关于限制在电子电器设备中使用某些有害成分的指令》(Restriction of Hazardous Substances)。该标准已于2006年7月1日开始正式实施,主要用于规范电子电气产品的材料及工艺标准,目的在于消除电机电子产品中的铅、汞、镉、六价铬、多溴联苯和多溴联苯醚共6项物质,并重点规定了铅的含量不能超过0.1%,使之更加有利于人体健康及环境保护。
ERA Technology:英国公司名称,参与ROHS标准的制定