基于即时通讯平台的运维告警方法 装置及设备

(整期优先)网络出版时间:2023-11-15
/ 2

基于即时通讯平台的运维告警方法 装置及设备

黄维梅  吴清川  李炳介  何书毅

海南电网有限责任公司信息通信分公司    海南省澄迈县   571924

摘 要:本实例涉及通信领域,具体涉及一种基于cmdb和报警图的智能运维方法、设备、电子设备和计算机可读存储介质

关键词:即时通讯平台运维告警方法装置设备

    一、背景技术:

随着网络功能虚拟化(network function virtualization, nfv)技术的发展,电信运营商的通信网络设备正逐步从专用硬件(各设备厂商不同)转向通用硬件(x86架构通用服务器),并部署在云端。传统的报警处理、故障判断、自愈等运维方式都是基于ct(通信技术)的运维手段,无法向智能化迈进一步。需要一种融合it(信息技术)思想的智能运维技术,即传统的ct(通信技术)运维系统,向ct+it运维系统转变。因此,需要一种或多种方法来解决上述问题。



    二、技术实现要素:

智能操作方法、设备、电子设备以及基于cmdb和报警图形的计算机可读存储介质,至少在一定程度上克服了相关技术所带来的一个或多个问题的局限性和不足。基于cmdb和告警图的智能运维方法包括:资源配置步骤、配置动态缓存区隔离、配置动态缓存区与运维策略区、智能分析区之间的数据通信规则、配置与外部系统的数据同步规则;动态缓存步骤根据预设的维度将it环境的配置和资源更改信息从配置管理数据库同步到每个隔离区;运维策略支持步骤,存储故障经验库、厂商说明库和告警关联规则库,为智能分析区提供运维策略支持;智能分析步骤实时同步网络运维支撑系统各节点的告警信息,并根据预设算法将动态缓存区和运维策略区信息进行组合,生成全景告警图和处理策略组,实现数据中心的智能运维。

1. 在此示例中,资源配置步骤还包括根据要获得的空间大小或资源、配置更改时间分段和it基础结构类型属性对动态缓存隔离区进行分区。

2. 动态缓存步骤还包括:动态缓存包含多个隔离区,由配置中心手动划分。维护策略支持的步骤如下:故障经验库中包含已存在的告警处理策略。根据专家经验和历史经验数据,初始创建并导入故障经验库和告警关联规则库。制造商指令库由各通信设备制造商提供,并在制造商指令库中作为统一的映射关系进行编译。

3.智能分析步骤还包括:智能分析与网络运行支撑系统互联、报警与故障自处理等动作交互;与动态缓存对接,获取故障对应的最新资源和配置数据。与运维策略区对接,获取历史经验、告警关联规则和批量命令模板。当告警信息从网管系统传送到智能分析区域时,基于动态资源和配置数据、策略和规则数据生成全景告警地图。为告警图的每个分支节点分配策略,包括处理方案和自愈指令;策略返回给oss系统,由oss系统决定下一步的自动动作,实现故障自愈。报警图的扩展可根据实际情况进行设置,设置位置在配置中心。将一段时间内生成的告警图形存储在智能分析区,形成图形仓库。累积一定数量的映射后,通过内置的比较算法,将新的告警关联规则整理出来,推送到运维策略区域保存。

4. 策略分配和交付流程:将策略分配给告警图的分支,并将策略发送回网管。然后系统决定下一步要自动执行的操作。您可以添加一个交付路径,并将其一路发送到运维终端。运维人员可以进行二次决策或调整执行策略。调整范围包括自动执行时间和范围。更新运维策略区域的操作步骤:网管系统将告警处理结果上报到智能分析区域。智能分析区将处理记录和验证策略推送到运维策略区保存,完善故障经验库和告警关联库。更新策略时,系统会自动对比告警经验库中已有的策略,只记录新的策略。如果存在类似的策略,则不记录新的策略。

三、附图说明

基于cmdb和报警图的智能操作,包括:

(1)配置中心,用于配置动态缓存区隔离区的分区,配置动态缓存区、运维策略区、智能分析区之间的数据通信规则,配置与外部系统的数据同步规则;

(2)动态缓存,用于按照预设的维度将it环境的配置和资源变更信息从配置管理数据库同步到各个隔离区;

(3)运维策略区,用于存储故障经验库、厂商指令库和告警关联规则库,为智能分析区提供运维策略支持;

(4)智能分析区,用于实时同步网络运维支撑系统各节点的告警信息,并根据动态缓存区和运维策略区信息,按照预设算法生成全景告警图和处理策略组,实现数据中心的智能运维。

本实例中基于cmdb和告警图的智能运维方法中,配置了动态缓存区的隔离区,配置了动态缓存区、运维策略区和智能分析区之间的数据通信规则,配置了与外部系统的数据同步规则。根据预设的维度,将it环境配置和资源更改信息从配置管理数据库同步到每个隔离;存储故障经验数据库、厂商说明数据库和报警关联规则数据库,为智能分析区提供运维策略支持;实时同步网管的告警信息,并将动态缓存区和运维策略区信息结合预置算法生成全景告警图和处理策略组,实现数据中心的智能化运维。

一方面通过基于cmdb和报警图的智能运维技术,为各链路故障自动处理提供更准确的操作指导和自动指令,缩短云部署模式下电信网络设备的故障持续时间,提升用户体验。另一方面,实现了云部署后电信运营商通信网络设备的通用化、智能故障排除、故障自愈等智能运维问题。

四、具体实施方式

本实例中,我们首先提供了一种基于cmdb和报警图的智能运维方法。如图1所示,基于cmdb和报警图的智能操作方法可以包括以下步骤:

1. 在资源配置步骤s110中,配置动态缓存的隔离分区、动态缓存与运维策略区、智能分析区之间的数据通信规则、与外部系统的数据同步规则。

2. 动态缓存步骤s120根据预设的维度将it环境配置和资源更改信息从配置管理数据库同步到每个隔离区域;

3.运维策略支持步骤s130存放故障经验库、厂商指令库和告警关联规则库,为智能分析区提供运维策略支持。

4. 智能分析步骤s140实时同步网络运维支撑系统oss的告警信息,并根据预设算法将动态缓存区和运维策略区信息组合,生成全景告警图和处理策略组,实现数据中心的智能运维。

在基于cmdb和告警图的智能运维方法中,配置了动态缓存区隔离区,配置了动态缓存区与运维策略区、智能分析区之间的数据通信规则,配置了与外部系统的数据同步规则。根据预设的维度,将it环境配置和资源更改信息从配置管理数据库同步到每个隔离;存储故障经验数据库、厂商说明数据库和报警关联规则数据库,为智能分析区提供运维策略支持;实时同步网管的告警信息,并将动态缓存区和运维策略区信息结合预置算法生成全景告警图和处理策略组,实现数据中心的智能化运维。

本实例一方面通过基于cmdb和报警图的智能运维技术,为各链路故障自动处理提供更准确的操作指导和自动指令,缩短云部署模式下电信网络设备的故障持续时间,提升用户体验。另一方面,实现了云部署后电信运营商通信网络设备的通用化、智能故障排除、故障自愈等智能运维问题。

五、技术总结

综上所述,智能运维方法、设备、电子设备和存储介质基于CMDB和报警图。该方法包括:配置动态缓存区隔离分区,配置动态缓存区、运维策略区、智能分析区之间的数据通信规则,配置与外部系统的数据同步规则;根据预设的维度,将IT环境配置和资源更改信息从配置管理数据库同步到每个隔离;存储故障经验数据库、厂商说明数据库和报警关联规则数据库,为智能分析区提供运维策略支持;实时同步网管的告警信息,并将动态缓存区和运维策略区信息结合预置算法生成全景告警图和处理策略组,实现数据中心的智能化运维。本实例通过基于CMDB和报警图的智能运维技术,实现了专用硬件和通用硬件的集成。

     参考文献:

[1] 计算;推算;计数设备的制造及其应用技术. 国知局. 2023-05-10.