数据中心机房监控系统设计与运用研究

(整期优先)网络出版时间:2017-12-22
/ 2

数据中心机房监控系统设计与运用研究

金新宇

上海贝电实业(集团)股份有限公司上海201206

摘要:随着信息网络技术的不断发展,各类大、中型组织的网络信息化建设的设备资金投入日趋增加,其职能运行与计算机网络的结合日趋紧密。网络的维护管理负担也日趋繁重。各类规模大小不等、设备种类、数量不同的网络设备机房广泛分布于用户各分支机构所在地域,由于欠缺与运行网络的规模体系相对称的运维系统,数量众多的无人值守机房的物理运行环境状况、动力配电状况、设备运行状况、人员活动状况以及消防状况的变化包括可能出现的危急状况,均无法得到及时的发现和处理,也就很难被有效预见、防范和避免。因此,由于运行环境造成的网络运行的不稳定和网络设备的隐性寿命衰减,以及由地域楼宇间的距离和区隔造成的管理维护的不便所导致的综合运维开销和建设开销相当巨大。本文以数据中心机房监控系统设计为主要论点,根据现有设计理念和设计常态对数据中心机房监控系统设计过程中的技术应用和设计要点进行简要的概述,明确其设计和应用的目的。

关键词:数据中心;机房监控;系统设计

引言:

为保证机房设备的良好运行状态和设备使用寿命与安全,必需对网络运行环境的电力供应、温度、湿度、漏水、空气含尘量等诸多环境变量,UPS、空调、新风、除尘、除湿等诸多设备运行状态变量,进行24小时实时监测与智能化调节控制,以保证网络运行环境的稳定与网络软硬件资源、设备的安全以及相关信息数据资产的安全。因此设计建设一套能够对网络物理运行环境变量、设备状态变量以及安防、消防状况进行全方位监测、智能化自动调控报警,分布式远程控制管理的系统,从而实现网络维护管理本身的智能化、网络化,从物理最底层开始全面保证网络安全已经成为各类组织当前信息化建设的首要之务。

一、数据中心监控系统的构成

生产单位为了保证生产过程的高效性和精确性,一般会采用数字化设备进行产品要求较为精确部位的生产工作,在实际生产过程中,生产单位的数字化设备都会按其性能和线路布置情况进行较为合理且层次鲜明的分级工作,并最终汇集至一个总体控制中心进行统一的科学调配。为了保证机房内部能够不断的高效运作,为了保障机房生产的正常性,应当设置机房内部环境的监控系统,以保证机房内部设备安全,通过对机房内部环境、机房设备运行状态、机房内部设备程序监控等措施,实施把握机房内设备运行的数据,及时得到数据不正常信息,并随时对不正常现象进行有效排除。目前,我国较为理想的机房环境主要包括能够满足机房内设备正常使用并且受外界环境影响较小的供电系统、当紧急情况发生时能够自动启动的应急处理措施系统、对机房内部环境指标进行合理调节的空气交换系统和目前我国该领域最常用的不间断电源等。数据中心机房设计工作不光考验设计人员对电路设计、软件编程、线路布置合理性的熟练应用程度,还是对设计人员对电气原件知识的考量,在设计过程中,设计人员还应当了解市场上常用的原件的各项性能,在设计的系统内,其原件应当能够承受正常使用过程中产生的热量、外力等作用的影响,并能够在一定程度上达到兼容的效果。在设计过程中,设计人员应当严格按照设计规范的规定进行设计,并对其原件的散热、功率等方便进行充分的考量,保证系统工作的合理性和安全性。

二、监控系统的实际应用分析

1、UPS系统监控

UPS是数据中心机房为IT系统提供源源不断电源的一个十分关键的设备,数据中心包括服务器、网络交换机、小型机以及路由器等设备,均需要采用稳定的不间断的电源进行供电,这样就能够预防数据不丢失。所以,监管好UPS系统显得非常重要。在数据中心的电源区域,环境监控系统经过UPS厂家所提供的智能通信接口与通信协议,实时地监视UPS的整流器、电池、逆变器、负载以及旁路等各部分的运行状况以及参数等。数据中心机房环境综合监控系统能够非常全面地对UPS实际状况加以诊断,一旦UPS报警,将自动切换至相应的UPS运行的画面。

2、精密空调系统监控

数据中心综合环境监控系统经过机房精密空调自带的智能通信接口,能够全面实时地对空调的运行状况、监控空调各个部件等加以诊断,且能够对空调设置参数进行远程调整与修改,从而实现空调的远程开机与关机等。环境监控系统一旦监测到出现报警或者参数越限,将自动切换至空调系统相关的运行画面,越限参数颜色将会出现变化,且伴随有报警声音以及相应的处理提示。对于重要的参数而言,可作一条曲线进行记录,用户能够通过曲线记录直观地看到空调机组的实际运行状况。

3、配电参数检测

电量测量仪集中了很多参数,包括相电压、相电流、线电压、线电流、有功功率、无功功率、视在功率、频率以及电能等多参数的检测仪表。该仪表具有报警以及智能通信接口,能够与环境监控系统主机之间相连接,便于用户较为便捷地对电流以及电压读书进行读取,以了解供电质量,除此之外,还能够对所监测线路的配电参数及历史曲线进行查看。

三、系统实现方式

1、网络设备监测的实施方法

第一、能够对触发事件(告警事件)进行记录,由管理人员根据需求对各类事件进行分类,实现对事件的过滤;

第二、能够通过定义(根据事件的来源、类型、报警级别等)实现对事件的过滤和分析,按照事件的关联设置功能,自动区分和抑制重复事件,减少系统负载;

第三、可以按照设置,自动识别与新生成的事件相关的旧事件,从而直接反应当前的最新状态,使管理员不被过时的信息所干扰;

第四、可在网络设备出现故障,发出异常日志时帮助管理人员及时接收、发现异常日志,

在配置发生改变时及时报警。

2、服务器监测的实施方法

服务器监测应包括以下内容:

第一、监测服务器运行状况,包括服务器CPU、内存、磁盘的使用情况,监测的系统平台应包括Windows、主流的UNIX等;监测Windows平台和UNIX平台上运行的相关进程、服务的运行状况;

第二、监测服务器网卡的运行状况,如网卡的流量、状态和丢包率等;

第三、对系统的日志变化情况进行监测,支持通过匹配查询、设置过滤条件等方式进行更深层次的分析。

3、数据库软件监测的实施方法

在应用层面,监测系统应可以直接了解数据库执行一段SQL语句花费的时间,例如让程序定时执行一些重要的与关键应用相关的SQL语句,如果查询时间超过阀值或查询结果不正确,即表明数据库出现问题在系统资源层面,监测系统应可以监测到数据库服务器和客户端的通信端口和数据库的关键进程,当出现问题的时候能够及时告警,使管理员能够迅速发现问题。

结语:

数据中心机房监控系统设计需要有先进的设计理念、前沿的科技水平、高效的设计团队、素质较高的设计人员作为保障,设计过程中,设计人员应当对数据中心机房监控系统的应用环境、应用目的、应用成本等方面进行综合考量,在保证设计质量满足客户需求的同时,要尽量减少成本投入和运行成本,在一定程度上保证其经济性。

参考文献:

[1]唐亮.数据中心机房监控系统设计与应用[J].信息系统工程.2014(10)

[2]李颖.机房监控系统的设计与实现[J].中国科技信息.2010(13)