论移动通信机房设备故障集中监控

(整期优先)网络出版时间:2018-10-20
/ 2

论移动通信机房设备故障集中监控

廖晓航

廖晓航

中国移动通信集团广东有限公司南海分公司528200

摘要:随着计算机与通信技术的快速发展,机房数量也在骤增。机房主要用来放置计算机系统或通信网络的核心设备,为了保证设备正常运行,机房装有许多配套设备,这些配套设备必须24小时监控,任何一种异常情况都必须得到及时有效地处理。移动通信机房设备故障集中监控系统将所有设备维护终端集中在一个统一平台输出告警,所有不同设备的故障集中产生声光告警,该系统使得监控人员只需要在同一平台处理日常告警。对安装在本地区内的话务网、传输网、数据网及所有相关设备的运行状况实时监控,特别是将交换网元、BSC网元以及传输网设备的监控作为重点,实时查看上述各网元上的各类告警信息,特别注意话务网、传输网设备上告警的关联性,并通知相关人员负责故障的受理和处理。

关键词:设备故障;集中监控;故障

一、移动通信机房设备故障集中监控系统特点简述

本系统能够实现五大监控功能,为机房安全提供多层次、多种手段的防护。

1.1集中实时监视功能

监控系统联通各数据处理终端,实时监视各设备的参数运行情况,智能化分析反常参数,并将结果显示在控制终端的屏幕上。岗位上的值班人员通过对告警信号的识别,以发现设备异常,从而采取及时的维护措施。

1.2集中实时声光告警功能

监控系统对于检测到的异常信号进行集中处理,将所有设备故障告警指示统一于独立体系的声光告警箱内产生实时警报。按照故障的处理顺序,首先由值班人员发现警报,其次通知专业技术人员进行及时维护,直到警报声消除后才能表示设备正常。

1.3集中循环监视功能

监控系统对机房内设备和所有的维护终端通过大型投影屏幕进行监视。电脑自动切换画面,无死角显示所有维护终端,并在每一个设备上停留30秒以便于值班人员详细观察状况。该监视流程允许手动干预,值班人员可以选择特定的画面显示某一维护终端,也可以设定改变画面停留时间。

1.4用户管理功能

本系统设置不同等级的权限,针对不同等级的维护人员。分为三级:SuperAdministrator、Administrator、User。这三级管理范围和职权不同,针对不同的管理岗位。不允许越权操作。

1.5远程管理功能

监控系统支持远程调控和动态管理,维护人员既可以在本地对维护终端进行权限内的操作,又可以通过特定网络连接管理系统,实时化了解监控动态。

二、移动通信机房设备故障集中监控系统设计与实现

1.系统结构概述。方案设计充分考虑移动机房的实际要求,整个监控系统采用逐个设备汇接的结构,将所有设备故障终端接入到KM0216服务器进行集中监控。在设计中充分考虑系统的稳定性、兼容性、系统所有设备的性价比、及其系统今后扩展、扩充需要。

监控站用来实现各种上层应用以及系统配置,监控人员只需要在设备故障集中监控系统处理日常告警,管理人员可以通过近端或设备故障集中监控系统进行数据管理、安全管理、配置管理、报表管理。移动通信机房设备故障集中监控系统选用一台AltusenKM0216MatrixKVMSwitch,来进行所有服务器的管理工作。选用USB的CPU端模块KA9120及CE250网络线来将服务器的键盘及鼠标连接到KM0432上。在视讯方面,用VS-82A将视讯一分为二,一方面传送给本地的显示器,另一方面透过KM0216与CPU端/控制端模块传送给远程的投影机,使得每台服务器都能保留原有的键盘、鼠标、显示器,不影响在本地的正常使用;同时,也能透过KM0216进行切换管理。在投影机一端,我们透过一台4埠KVM切换器CS-9134来选择三个KA9222控制端模块,以控制每个投影机的内容来源,以满足方案要求,也就是从网管主机中选择应显示某一台主机的视讯。此外,还配备了一个IP远程控管装置CN-6000,以实现透过因特网来控制网管主机的需求。

2.系统功能概述。本系统将设备故障集中监控系统分为五大功能,分别为集中实时监视功能、集中实时声光告警功能、集中循环监视功能,用户管理功能,远程管理功能。

(1)集中实时监视功能。实时监控系统通过各维护终端将当前被监视设备的运行参数集中采集,实时显示在监控电脑屏幕上,监控人员通过该系统依据设备故障对系统影响程度提供不同级别的告警信号,以提醒机房监控人员及时通过系统维护终端进行软维护或以不同方式(电话、短讯等)通知相关维护人员处理。

(2)集中实时声光告警功能。该系统从网管终端发出的告警信号端子提取信号进行处理,将所有设备故障告警在同一集中声光告警箱产生实时告警。监控人员报警发生后,一般按以下步骤来进行处理:①通知。首要的是将报警信息告知给相关人员。②确认。表明已经知道报警的发生,正在处理。但此时报警仍然存在,没有消失。③消除。经过处理,故障消失,设备恢复正常,报警也随之消失。

(3)集中循环监视功能。该系统对所有维护终端都能够通过2台投影屏幕来循环监视,设置自动轮流显示所接维护终端,每个终端可设置停留时间(3s~60s);还可以用手动选择,当手动选择后,画面停止在选择的维护终端,直到再次选择自动显示按键。

(4)用户管理功能。本系统将管理权限分为三级:SuperAdministrator、Administrator、以及User,各级管理人员的管理范围和权限不同。

(5)远程管理功能。本系统提供远程管理功能,维护人员既能通过该系统进行数据管理、安全管理、配置管理、报表管理,又能在本地维护终端对设备进行相应的操作维护。

三、移动通信机房设备故障集中监控系统结构概述

3.1系统网络的拓扑结构

监控中心主服务器是最终处理端,向下连接传输网。传输网由各项采集器构成,由烟感、水浸、温湿度、门禁。再下一级是控制开关,包括电源开关、发电机组、UPS和空调机。系统分为两大部分的监控,分别是动力设备的监控和机房环境监控。智能化报警装置和多功能故障判定装置可以减少值班人员的数量甚至实现无人值守。

3.2结构简介

现场监测点有开关电源、湿度、温度、烟雾报警器和环境量的其他实时数据。能够有效地接受监控对象的告警信息,并把这些信息传到总服务器。监控点受总监控服务器控制,并能根据接受的命令做出相关的调整。

监控中心能够同时处理多个监控点的不同信息,对传输过来的告警信息分析计算,通过多样化的告警手段通知相关人员,并对故障资料进行分类储存,或者生成统计图表供人们参阅以找出故障发生的规律性。监控中心必须有以下几个方面的功能:一、周期性采集数据与实时性分析数据。二、智能化预处理告警信息与后期信息分析,具备数据查询和统计功能。三、自动保存设备运行相关参数和设备工作日志。四、灵活性反应告警信息,不仅能够及时通知相关人员解决故障,也要在故障消除后通知其解除告警。五、闭环管理功能。六、记录信息导出功能,能够将历史数据保存至少一年的时间,并可以转存储存介质。

4、移动通信机房设备故障集中监控系统实际应用效果

在采用了机房故障集中监控系统后,可以取得以下几个方面的效果:首先,设备的科学管理水平得到提高,提升了管理人员的工作效率,降低了管理人员的工作失误程度。其次,减少了维护人员的数量,减少了大量的巡检维护经费,节约了开支。第三,缩短了故障处理时间,提升了通讯系统运行的稳定性,能够保持移动数据交换终端始终处于良好的状态,减少了发生事故的几率,一定意义上为企业的良好发展做出了保障。总体来说,有效地运用移动通信机房故障集中监控系统可以取得较大的社会效益和经济效益。

结束语

移动通讯必须要保证实时通畅,不能够因为设备的原因对用户产生使用影响。在移动通讯终端的机房管理上,我们要建立和完善机房故障集中监控系统,以便于及时的发现机房内不合理环境和反常设备运行参数的出现,减少出现事故的几率。本文主要介绍了移动通信机房故障集中监控系统的工作原理和结构组成,指出了它的设计建造准则和作用,希望能够为相关工作人员以有益的参考。

参考文献:

[1]朱玉锦.调度自动化机房监控系统的设计与实现2017.4

[2]张天开,张晶明.机房环境监控网络系统的设计及应用2016.2

[3]赵彬.高校机房监控系统的设计与实现2011.9