智慧通信机房运维管理手段浅析

(整期优先)网络出版时间:2024-04-30
/ 2

智慧通信机房运维管理手段浅析

由欣

摘要:本文主要以将传统通信机房改造为智慧机房为设计理念,通过运用高新通信技术,提出实现机房智能运维的环境搭建和实现方案,达到精简值勤人员、提升运维能力的目的。

关键词:智能化运维、网络可视化、光缆在线监测

随着信息技术的飞速发展,机房的智能化建设越来越重要,传统的人工巡检值勤方式已无法满足机房运维需求。本文立足改善传统通信机房运维现状,研究智能化运维、网络可视化运维等技术在通信机房的应用,对提升机房运维管理有重要的现实意义。

一、智能化运维监控平台

采用智能化运维,建设统一平台,提供环境监测、动力监测、安防监控、蓄电池管理监控等功能,同时辅以统一管理平台,实现机房各重要点位的智能化管理。

环境搭建

环境监测:实现机房温度、湿度、水浸、烟雾、大气等基础环境监控,实时掌握机房环境运行情况;

动力监测:实现机房开关电源、UPS、配电柜设备监测,实时掌握机房电源运行情况及性能指标;

安防监控:实现在统一网管平台上对通信楼摄像头监控画面实时查看、录制、拍照和视角方位调节;采用智能门禁管理,包括人员出入管理、远程开门等。

电池监测:实现对电源机房UPS和开关电源蓄电池组运行参数进行监测,及时发现潜在劣化的电池。

智能灭火:实现自动探测火情、自动报警、自动灭火。

实现方案

智能化运维监控平台使用采集服务器、应用服务器、数据库服务器三者相互独立部署。采集服务器完成设备数据采集,应用服务器为用户提供访问入口,数据库服务器保证采集数据和访问数据的入库处理,数据容灾服务器保证平台服务器的数据定时或实时同步到数据容灾服务器,防止数据丢失,GIS服务器为用户提供地理位置信息服务,如图所示。

采用3D建模管理,真实模拟机房现场环境。通过对各机房独立设备、架式设备、板卡进行仿真建模,实现视频监控、环境监控、机柜监控、门禁监控等功能,值勤人员可以通过客户端实现对各点位的远程监控,通过三维可视化软件快速发现机房环境异常。

呈现机房的温湿度、烟感、空调、水浸等环境信息,同时对机房的机柜、设备的接地参数实时监测。发现温湿度异常告警时,值勤人员能够及时调节机房温湿度、机柜温度等;出现电源类故障可通过参数异常发出报警,便于值勤人员进行设备维修或蓄电池更换;如遇突发火情,系统立即发出声光告警,值勤人员采用七氟丙烷气体灭火系统进行智能灭火,其工作模式是全淹没式,在瞬间把气体释放到机房内,把机房的氧气挤压出去,起到灭火作用,具有轻便可移动、灭火效能高、速度快、对设备无污损的特点。

二、网络可视化运维管理平台

由于网络体系越来越庞大,覆盖业务越来越广,维护工作量和难度越来越大,特别是重要网系对值勤能力要求很高,加之下级台站维护人员经验欠缺,面对众多的专业设备,无法实时了解其运行状态,因此提升网络值勤运维能力十分重要。通过使用网络融合运维管理平台,可以实现重要网系交换机、路由器、防火墙、服务器等资源的统一管理,通过可视化监控、智能化分析来提升运维效率,降低故障发生频率,保障系统稳定运行。

(一)环境搭建

集中化管理:多种设备类型统一管理,设备信息、告警、硬件部件信息集成呈现。

可视化监控:全网拓扑视图多维度监控,实时感知设备故障并进行网络质量诊断。

智能化管理:实现IP地址的统一管理和监控,实时检测网络链路的连接状态,提升网络安全性。

(二)实现方案

将网络硬件设备、部件、运行状态等关键信息集成显示,帮助值勤人员快速全方位了解设备,从而在设备故障时做到快速发现、快速定位、快速解决。构造网络的拓扑结构,用来呈现网元的组网情况和运行状态。值勤人员可以根据实际需要,选择网元添加到自定义拓扑,对重要设备网元进行精确监控。

  提供IP地址全生命周期的管理,包括IP地址创建、分配、回收和查询等。可以对用户进行分组管理,查看IP地址使用异常情况,检测空闲IP,及时发现长时间从未使用的IP并进行回收,节省IP地址资源,如图所示。

采用智能网络配线管理模块,使用硬件和软件结合方式对网络配线架进行管理。实时检测网络链路的连接状态,通过指示灯指导维护人员进行操作,能够以图形化的方式显示网络的连接拓扑;网络发生变化后,管理软件内的图形化架构会实时更新,提高自动化水平;当有端口插拔操作、新端口接入时,管理软件实时上报告警,自动定位具体告警端口并可对该端口禁用,防止非法外联,如图所示。

三、光缆在线监测管理平台

随着光缆数量的增加以及早期敷设光缆的老化,传统的光缆线路维护模式查找故障困难,排障时间长。光缆监测技术可以对光缆资源进行动态管理,观察光缆线路传输性能的劣化情况,帮助光电缆维护人员及时发现和预报光缆隐患,降低光缆阻断的发生率,快速定位故障点,缩短光缆抢修时长。

(一)环境搭建

光缆资源管理功能:具备以GIS地理信息为基础的图形化的光缆、管井、杆塔、接头盒管理功能。

光缆通信质量实时监测:能够实时监测光缆运行状况并定期测试。

故障精准定位:光缆发生故障时,能够进行故障精准定位,并在GIS地图上显示出来。

(二)实现方案

光缆监测运维系统平台需对光缆信息进行管理,实时监测光缆网络中的全部或部分光缆,通过OTDR技术,及时发现被监测光缆的损耗情况,上报损耗异常告警信息,并把这些信息记录在数据库中通知给值勤维护人员,实现光缆故障的事先预报和事后快速查询。

实施上推荐使用备纤监测方式,该方案采用离线监测方式,占用空闲纤芯,通过定时轮巡切换控制OTDR的唤醒测试,如图所示。

当监控模块监控到告警时,将告警信息传送至监控中心,产生告警指示,并将故障点标识在电子地图上,给出故障点距离。

高新兴智慧机房运维管理充分利用了现代科技的力量,将复杂的机房运维管理简单化、智能化、直观化。通过引入先进的技术和管理手段,实现对机房的全面感知、科学预警和智能管控,达到提升无人值守机房的运维管理、精简人力提升效率的目标。

参考文献

[1]田贞军.无人值守机房环境监控系统设计.农村科学实验.2017(6):81.

[2]彭城.职业院校教学机房管理中的智慧化提升.2021(5):81-83.

[3]张楠.无人值守机房环境监测系统[J].中国交通信息化.2021(08):136-138.

[4]韦国富、稽凌、钟伟.智慧机房无人值守系统设计及实现[J].信息通信.2020(04):284-286.

1—