电力信息通信系统集中监控告警平台的研究与应用

(整期优先)网络出版时间:2017-12-22
/ 1

电力信息通信系统集中监控告警平台的研究与应用

张丽霞

(国网山西省电力公司信息通信公司030001)

摘要:为了强化信息通信系统运行过程中的故障预判能力,及时监控告警,并提升信息通信系统稳定运行的能力,本文研究探索了信息通信系统集中监控告警平台,通过统一的管理界面和灵活多变的告警机制,实现企业对业务应用、桌面安全、网络系统运行状态的集中监控,最终实现信息通信系统运行的监控、预判、告警的自动化全过程的管控。

关键词:信息通信系统;集中监控;告警;应用

0引言

随着我国经济的迅速发展,对于电能的依赖也越来越大,安全稳定的电网对于整个国民经济的快速发展不可或缺,而电力行业自身也是我国国民经济的重要的支柱产业之一。电力系统的安全问题对于整个国民经济的安全稳定运行具有十分重要的意义。

1项目建设必要性

随着信息化建设的逐步深入,电力网络结构日趋复杂,电力信息通信系统趋于多元化,信息安全面临许多问题,信息通信系统的运行监控与管理主要依赖于管理员,而系统管理员往往疏于日常监控与管理,只有在出现故障时才疲于应急维修,这种常规的工作模式存在以下问题:

1)不便于追溯分析与相关性分析。信息通信系统出现问题,可能的原因很多。总体上是软硬件环境,但具体原因有网络、硬件故障、操作系统故障、服务配置与运行、病毒、异常进程、负载等。根据维护经验,许多故障是重新启动一下服务器就好,系统管理员往往对具体什么原因不追查或不便追查。有些原因是积累性或累加性的,如不必要的服务对信息系统安全运行的影响等,这些都要进行相关性分析。在故障处理时,相关性分析尤其重要,可以迅速定位故障、减少判定时间。

2)工作效率低、发现潜在问题难。由于企业内部信息系统管理员并不是专职的系统管理员,同时用于信息系统维护的工作时间不是很多,特别是在信息系统运行正常时,往往巡查流于形式。在一个个界面切换,在短时间内从满屏信息中排查出异常迹象,效率很低,发现潜在问题的可能性极小。

3)对于全局性问题不易统一处理、根本解决问题。对于一些特定类型的故障,如病毒、漏洞引发的故障,往往是全局性的,在范围内所有服务器都可能存在同样的问题。处理这类故障隐患,需要统一排查统一处理。而人工或纸质记录表方式不能支持这方式。

同时,桌面终端任意接入,安全策略得不到统一和有效控制,对资产信息采集统计与远程监控手段不足,用户行为难以控制,存在引发信息安全事件的风险,终端维护成本较高等问题制约和影响着信息化健康持续发展。因此,科学、合理的构建和完善信息通信安全防护体系,研究信息通信晋中监控平台,十分具有必要性。

2项目目标

1)建立统一的监控告警平台,将业务应用、桌面安全、网络监管在同一个页面中集中展示,同时具备IMS系统展现页面功能,方便各业务系统运维人员使用。

2)具备更加优化的系统监控告警机制,统一的数据监控来源,提高监控告警的准确性。

3)具备丰富的告警辅助功能,采用界面气泡图、声音告警。

4)告警信息状态的多样性,除正常、异常两种状态外,可根据需要扩展为正常、告警、预警、无数据等多种状态。

5)监控指标数据可配置,根据运行考核方式的变化,对关键告警各项指标数据进行灵活配置和修正,确保运行监控指标稳定运行。

3项目内容

为了进一步扩大信息运行监控水平和范围,提高信息运行监控准确性,强化信息运行过程中的故障预判能力,保障信息运行稳定,需要一套更加完善的自动集中监控告警系统,通过统一的管理界面和灵活多变的告警机制,实现省公司对业务应用、桌面安全、网络系统运行状态的集中监控,能够将故障从事后处理转变为主动监控预防,并在在系统发生异常时能够及时、准确的通知检修人员,提高应急处理响应速度和抢修能力,实现信息通信系统运行的监控、预判、告警的自动化全过程的管控。

1)集中展示:通过使用红绿灯方式,大屏集中展示业务系统、机房动环、信息安全等关键运行指标数据。对于存在问题的数据,使用多种告警方式:红灯告警、声音告警灯。

2)自定义配置:因不同时期关注的关键运行信息不同,因此后台管理功能包括页面配置、坐标配置、参数配置。页面配置指实现对展现界面的定义,坐标配置指实现对展现界面维度文字以及顺序的配置,参数配置指实现对坐标维度内指标取数语句和阀值的配置。

3)系统可通过配置连接字符串的方式连接oracle、sqlserver数据库类型进行数据采集。非oracle、sqlserver数据库,采用各系统实时直接推送至本系统数据库方式。

4项目技术路线

项目准备阶段主要采用文献法、调查法、比较法;实施阶段主要采用观察法、实践法、行动研究法、案例研究等方法。系统严格按照项目管理工作的规范进行研究,按照需求调研、概要设计、详细设计、业务建模、程序开发、系统测试、试运行、改进完善、正式运行的过程进行开发工作。

5总结

本文研究探索了信息通信系统集中监控告警平台,将业务应用、桌面安全、网络监管涉及的指标数据统一监控,作为电力公司信息运行监控工作提高的辅助管理工作手段,提高企业通信系统监控准确性,强化信息系统运行过程中的故障预判能力,及时监控告警,并提升信息系统稳定运行的能力。