数据中心机房环境动力设备的安装与维护

(整期优先)网络出版时间:2021-08-12
/ 3

数据中心机房环境动力设备的安装与维护

高翔

中国联合网络通信有限公司通化市分公司 134001




摘要:数据中心机房是热密度高的环境与场所,主要以服务器、交换机、路由器、存储器等IT类设备为服务对象,对部分环境动力设备的需求具有很强的特殊性。随着计算机系统设备数量与日俱增,规模越来越大,为保证信息数据中心机房安全正常运行,与之配套的供配电、UPS、精密空调等机房动力环境设备系统必须24h全天安全、可靠的为计算机系统提供正常的运行动力及运行环境。

关键词:数据中心;环境动力设备;通信网络;

数据中心机房内放置的都是精密的信息化设备,价值不菲,是企业的重要资产,一旦机房环境设备出现故障,会给数据中心系统带来致命损害。如机房环境温湿度过高过低,会使其设备寿命缩短,提高故障率。对此,加强对设备后期维护相当重要,必须引起重视。

基于某数据中心项目建设,阐述机房UPS、配电、空调等设备的设计与安装,提出日常维护管理措施,从而满足计算机系统和通信网络的安全正常运行。

1 工程概况

本工程为某企业数据中心机房改造项目,需要针对机房建设所需的环境动力设备,规划了机房UPS系统、机房专用空调系统、高压供配电系统系统以及相关联的集成服务的设计和施工。整个环境动力设备安装施工均要按照高要求、高品质、高标准、高可靠性的原则进行,能够满足信息中心各系统运行的需求。

2 数据中心机房环境动力设备安装

2.1 供配电系统设备

本工程环境动力设备UPS电源、机房空调、照明等供电采用两路市电源互为备份,且机房由专用柴油发电机系统作为备用电源,并通过ATS对市电电源间及市电电源和柴油发电机间进行切换。供电系统采用双母线,按照UPS独立供电原则备用一套作为供电母线在故障或需要维护的情况下承担所有负载。同时,供电管理电源分配采用电源列头柜,实行每台用电监控管理,通过电源列头柜从双母线供电系统两套母线引入电源至服务器等IT设备;对单路电源服务器选用静态切换开关为期选择切换一套供电母线供电,以此确保IT设备可靠用电。

2.2 空调系统设备安装

(1)在选择机房空调时,需要考虑空调的加湿和除湿功能,机房建设还应选择除尘效果好与空气净化功能的空调,制冷空调能够在365d×24h的环境下不间断运行,且空调机组具有远程监控及管理功能。本工程房间级空调TDAR1021共有两台,均位于4F机房内,外机通过吊装,安装在楼顶,空调采用下送风,上回风的形式满足机房内制冷需求。

(2)前期对场地进行勘测,主要目的是为了确定空调的安装位置,空调管道的安装路由,搬运的方法和通道等问题。空调分解位置需要提前预留好,利用预留好空调位置用于空调安装。安装前要确定好制冷管道的走向,空调位置直接出墙至室外平台利用预留的空调孔洞,空调开关放25mm²电缆线到空调。本工程空调管道焊接主要是对现场安装铺设空调的管道以及管道的保温部分,冷媒管道焊接时由专业经过严格培训过的焊接技术人员焊接,焊接时要对空调压缩机附近的控制线、传感器、电磁阀做好相应的防护,防止焊接时产生的高温损坏零部件,管道走向布局要美观,横平竖直,空调冷媒管道液管Φ16mm,气管为Φ22mm,冷媒管道固定要牢固,管道穿墙安装完毕必须可靠密封穿墙孔洞,在活动地板下布置管路,其管路走向与气流方向平行,尽量减少下送风气流阻力,并固定好内机与外机。

2.3 UPS系统设备安装

本系统采用了APC Symmetra PX系列UPS,根据数据中心实际负载情况,目前本机房UPS系统的容量配置为64k W,共有4个16k W功率模块,输出构成48k W N+1输出系统,最大可扩容到160k W,并根据用户需求配置施耐德(M2AL12-100)电池32节进行供电支持,可支持36k W30min后备时间。在UPS系统施工前,需检查现场是否适合现场工作的要求,检查UPS运行状态,确认UPS输入和UPS输出正常,隔离电池监控。将UPS切换至维修旁路,关闭UPS并断开UPS电池开关,检查UPS报警信息,确认电池开关状态正常。

2.4 动力环境监控系统安装

(1)数据中心设计部署UPS系统、精密空调系统等物理基础设施的设备,为了确保数据中心安全可靠运行,需要搭建一套机房物理基础设施监控系统,对机房的物理环境与安防,以及基础设施设备进行实时监测管理。另一方面,数据中心无专业的运维人员对机房进行维护,一旦机房基础设施设备或环境出现问题时无法及时发现进行处理,从而造成宕机隐患。本项目采用Stru Xure Ware数据中心管理平台环境DCE环境监控系统,其主要为监控机房的关键制冷和UPS设备,但同时可以方便接入大量APC机房环境监控设备,从而达到对机房整体温度、湿度、电力应用情况、局部热点、甚至气流情况的监控,同时与第三方软件结合,可在断电和紧急情况下可完成对服务器的自动关机,从而保护用户数据安全,通过监控并调整各设备设定点,达到可靠、高效、节能、环保的目的。

(2)由于本项目大部分设备均为APC产品,考虑到兼容性问题,对此搭建的APC Stru Xure Ware数据中心管理平台如下所示:(1)AP9465(APCDCE服务器主机),是DCE系统的核心,安装在客户设备最多的主机房内,提供约250节点的许可证,并在将来可持续扩展。大容量的硬盘保证可以存储大量数据,所有其他设备均接入该服务器,由AP9465进行存储,进行定期的自动备份增强了其数据可靠性,实际运维过程中可以查看3年前指定时间段的数据曲线。(2)Netbotz0570(APC环境监控主机),功能强大的环境监控主机,接入漏水报警绳,温湿度探头,摄像头,电子温度计、电子流量计和电子压力计(0~20m A输入,监控冷冻水机组的水温、流量、水压),第一时间发现机房异常,从而快速响应,保证机房运行正常,该设备还可扩展输出干接点信号,进行电话报警。(3)AP8853(APC PDU),该PDU可通过SNMP协议接入DCE中,从而观察到每只接口的用电容量,了解负载情况。(4)AP9335TH(APC温、湿度传感器),该数据中心共配置了约150只,直接接入AP8853,大量配置的温、湿度传感器可以完全掌握整个机房的运行情况,从而了解是否有空调损坏,是否存在热点。(5)NBPD0160(APC高清摄像头),该摄像头由POE供电,可实现动态录像,可选择远程存储,以此还原事件发生时的图像证据。(6)通过协议转换,接入伊顿UPS,冷冻水机组,柴油发电机故障信号,可通过点表编译,实现具体故障内容的报警。(7)全国其他机电设备及PDU,温湿度探头也通过SNMP协议接入该设备,监控全国各个机房。

(3)数据中心专家支持机架式安装与虚拟机安装两种方式。主机适用于安装在19英寸机柜,可以水平安装在机柜中,占用1U高度,也可以竖着0U安装在机柜中;传感器扩展盒适宜机架式安装,支持6个通用传感器,包括温度、湿度、漏水、烟感等等。多个传感器可以遍布数据中心的每个角落,使数据中心的环境尽在掌控。烟雾传感器可安装在机柜顶部或通道顶部,房间的关键部位,连接至环境主机的通用接口。各传感器都可通过网络线适当延长。

(4)本项目对该系统软件安装完成后,通过部署物理环境与安防子系统,实现了机房的真正无人值守,数据中心专家的部署实施,对机房内所有基础设施设备进行集中监测,统一报警,报表输出,从而极大提高了机房可靠性及运维管理人员的工作效率。但建好后经常性离线,并有大量重复警报,离线期间数据无法保存,一旦发生事故,对事件记录不利,经过查看事件日志及参数设置发现数据基本完整,但因是新建机房,网络通信会存在延迟,其设备的默认设置为5s内无法连接就判定为通信故障,而报警设置又是故障发生时立刻进行警报,经过配置更改为20s内进行判断,数据记录也由5s记录改为30s,再将故障发生后延长判断1min,1min内恢复则不再报警。更改完设置后报警邮件消失,且数据曲线完整,使得系统顺畅运行。

3 环境动力设备维护

(1)建立设备组织维护管理体系。建立健全的环境动力设施管理体系,可根据自身需求采取最佳运维管理模式,本工程从管理角度考虑,根据机房重要性程度,考虑技术的复杂性等问题采取混合模式对环境动力设备进行运维,在受到供应商基础技术支持培训后,明确了高低压供电、UPS供电、应急供电、制冷等环境的各项技术设计要求、设备配置标准及技术维护要点,并制定相应的环境设施维护制度、巡检制度、安全操作制度及应急制度等,提高内部维保人员技术水平,以此做到对环境动力设备隐患的预防,确保信息系统安全运行的目的。

(2)环境动力设备维护管理实施。环境动力设备维护管理主要是高低压供电、UPS供电、应急供电、制冷等环境的日常维护、故障发现进行的设备状态监控,以及日常巡视等三个方面。高低压供电系统维护主要是对各类高低压设备运行规章制度、设备标识的修订与完善,并对中央信号屏、电容器补偿工作状况、电缆夹层、防雷接地等进行定期检查和检测。UPS设备维护除了编制维护制度外,还应按照维护制度创建UPS设备维修维护卡、电池检测记录、电池放电记录等一系列工作表记录,同时注重UPS日常检查保养,及时发现故障隐患,并在定期维护检查UPS配备的密封蓄电池外壳是否存在膨胀变形、点断电压、内阻等是否存在异常现象。柴油发电机组的维护主要是对外部基建和壳体的清洁,避免受到油、水腐蚀,定期按照规定对机油质量进行检查及更换。此外,机房专用空调主要包括空调压缩机、控制系统、冷凝器、蒸发器和膨胀阀、加湿系统、空气循环系统的巡查与维护。

4 结语

数据中心机房环境动力设备为数百万个应用程序与进程供应动力。如何确保其稳定运转,为客户提供更优质的服务,成为机房运维管理部门必须要思考的问题。对此,机房环境动力实施的管理需要建立完整的制度体系,注意更多的细节处理,防设备损坏、防腐蚀性气体和易燃易爆物体,温度和湿度一定要控制好,严格控制在规定的标准范围内。本文基于某数据中心机房环境动力设备安装工程,在设备安装前,编制专项施工方案,严格安装过程技术管理,使环境动力设备顺利安装完成投入使用。同时,为了确保设备长期运行稳定、可靠、安全,数据中心运行维护是重中之重的工作。针对本项目设备维护建立了一套健全的管理体系,按照规定定期或不定期对设备进行维护,并提高设备维护人员的综合素质,结合环境动力系统设备特点,不断提高运维意识和业务素质。进一步增强做好运维工作的责任心,以此掌握各个环节设备运行状况,排除与解决各种警报故障,避免损失。