探析信息机房运维及其管理的主要策略

(整期优先)网络出版时间:2021-09-13
/ 2

探析信息机房运维及其管理的主要策略

吴庆升 庞丁黎

云南电网有限责任公司德宏供电局 678400


摘要:近年来,随着我国经济的发展,科学技术水平的不断进步,信息互联网等先进技术得到了全面的普及和应用,人们的工作和生活方式也发生了明显的变化。为了适应时代发展的趋势,各个企业都在进行信息化建设。信息室是企业内部信息交流的中心,对企业的发展起着重要的作用,受企业管理理念和信息管理水平等因素的影响,在实际的信息室管理过程中存在很多问题,因此,结合企业的实际情况,制定完善的信息机房运营管理策略,以促进企业信息化建设的顺利进行。

关键词:信息机房;管理本质;运维管理

随着计算机信息技术的不断发展,信息机房已无规则可循模数、质和量都发生了很大的变化,从以前的小型、简单化、具体化不断向大规模应用、复杂品种和立体化应用方向发展,尤其是云计算技术在机房服务中的应用不断深化,提高设备的运维管理水平显得尤为重要。需要信息机房运维管理人员不仅要了解网络技术和计算机技术,还要具备全面科学的运维能力,否则会直接影响设备的使用效率和使用周期,因此,我们必须高度重视信息室的运行和维护。

  1. 信息机房运行维护和管理的内涵

管理是反复完成预定目标而不得不进行相关的协调工作。为了有效保证信息机房的高效安全运行,保证相关服务器、设备、仪器的正常运行,机房必须有科学有效地实施机制作为保障[1]。从某种意义上说,信息机房的运维管理是对制定的规章制度进行全面操作、过程监控和直接改进的活动。建立良好有效的组织管理机制和相关流程体系是做好机房工作的重中之重。在具体的排程工作中必须根据具体的环境,具体修订一系列完整的机房运维管理办法,确保机房的有效运行和运维。有效的机制和系统被用来促进组织的运行和维护管理标准化是计算机机房运行和维护的基础。而相关制度体系需要在具体的运行维护中不断完善和更新,以便更适合具体工作的需要。对板线制是否按规章制度执行;检查是将要进行的具体环节和具体效果与制度机制初步制定的预期目标进行有效性比较,从而发现问题,挖掘经验;具体工作改进和推进就是要对挖掘出来的行之有效的做法进行检查,把具体做法转化为行之有效的做法,完善运输管理机制或原有的制度体系,建立实施制度,发现并要求总结经验,完善系统闭环运行管理体系。机房运行保卫中国管理制度主要包括:主要领导岗位责任制、岗位责任制、手术室管理标准、稳定运行制度、安全风险评估制度、日常出入室登记制度、手术室风险管理制度,等制度体系建设建立后,机房的运行维护有章法可循,管理规定也能起到较好的效果。

  1. 信息机房运维管理存在的主要问题

确保信息室的电脑等设备长时间运行,虽然从环境、管理、应急等方面做了大量细致有效的工作,但仍有一些问题难以避免,主要有以下几类问题[2]

  1. 方案类故障。一是备用交换机数量不足,造成后期扩容困难。二是楼层高度不够,后期下行电缆多堵塞风道导致空气供应不足。三是中线通过开关触点造成故障,发电时机器采用手动四极开关切换,切断零线时间过长,且零点漂移过大。四是配电开孔或电缆容量不足造成电源跳闸。五是空调下水管过细、过长、弯道过多,容易造成淤积。六是机房通风地板、吊顶格栅板未设置到位,形成房间热点。

  2. 操作性事故。一是个别运维人员认为供电比较差。简单来说,看不到相关的说明书也可以凭经验来完成,这样就可能造成事故,造成损失,如负载没有超过刻度值但已经超过跳闸设定值等[3]。二是在测量电流前关闭分支开关,设备仍由其供电时断电并停止工作。三是电气操作中未按双柱规定,造成蓄电池极性误接事故。四是地下插座连接,电线弱,不能加电源。五是清理配电柜顶部时,未注意初期施工留下的铁屑被扫掉,造成点火跳闸。六是服务器因此送电时,如果机柜插座不够,相邻机柜被非法借用,则在机房内提供单电源时使用相邻机柜过载跳电。

  3. 处理不及时故障。一是机房漏水已报警,由于值班人员疏忽而未及时处理,造成机房地板下大面积积水,形成巨大隐患。二是UPS放电,当电池快放完时通知楼下配电室快通电,但一直占线,直到连接时电池已经放完,导致停电。三是机房的空调模块坏了,但由于模块冗余,对机房温度没有影响。几天后,气温飙升,另一个模块因压缩机高压报警而损坏,使机房温度失控。四是开关后风扇出风口被多条电缆堵塞,影响送风。在安装和引导之后,发现了这种情况,但没有及时删除。后来,开关内部温度过高,机器停机,导致很多设备停机。

  1. 科学规划信息机房运维管理对策

  1. 运维机房防火。运维室的防火工作是当务之急。必须严格做好相关防火工作。相关管理人员应带头学习相关防火知识,具备必要的防火能力,遵守具体操作规程中的相关规定[4]。相关设施设备的拆卸必须在停电的前提下进行,绝对不能进行能带电气操作;设备的维护和实施也需要断电,然后进行维护保护;不使用溶剂油等液体清洗设备;机房严禁使用加热器具和吸烟。

  2. 运维机房安全用电。首先,计算机房从业人员必须掌握相关用电安全知识和技能,深入了解相关设备用电操作流程和要求,注意用电安全,确保无触电隐患。二是定期检查相关设备的电气安全,并填写检查记录。三是不得擅自接通电源。在选择相关设备时,要保证安全产品的质量。四是在接通电源前,必须再次确认连接器、连接线等是否安全,人员是否准备就绪等。

  3. 运维机房相关设备安全管理。运维室相关设备安全管理实施说明。在运维室内对有关设备要及时清理,建立定期检查制度。对特别重要的设备进行详细检查,及时发现相关设备的执行隐患,并进行详细登记。首先,相关人员必须掌握相关设备的操作规程和操作规程。二是要及时了解和检查相关设备的应用连接情况,及时掌握设备运行的工作状态。第三,未经许可,不得擅自转移设备设施,或擅自改变相关设备设施的物理连接方式提货。第四,任何相关的变更都必须提前计划,经过充分调研后,安排有资质的人员进行变更,并做好详细地变更记录。对于相关内容的变更,必须对变更后的相关问题进行处理,做好充分准备。

  4. 运维机房相关软件管理须知。运维室相关软件管理说明。一是及时了解相关情况使用软件,及时准备相关数据、数据库及日志复印件。二是严禁在重要服务器上进行软件测试,未经安全软件许可的其他软件,在安装相关软件前,必须经过严格审核,确保软件来源正规合法。安装后定期进行健康检查,了解是否对其他工作软件有影响。三是做好相关软件及时记录变化,提前估计安全风险,做好应急预案准备。

总结:总而言之,信息机房运维管理责任重大,意义重大,管理人员必须高度重视,大力加强学习,提高管理水平和操作技能,确保机房稳定高效运行,促进工作顺利开展。

参考文献:

[1]王旭,张建业,陈涛.电力信息机房智能化监控系统方案研究与设计[J].环球市场信息导报,2017(46):135-136.


[2]江晨颖. 面向智能电网的信息机房三维可视化管理系统的设计与实现[D].电子科技大学,2015.


[3]赵辛.信息机房施工及综合布线设计技术分析[J].信息通信,2014(11):161.


[4]吴茹辉.基于信息机房工程UPS电源的系统供电方式选择的重要意义探析[J].硅谷,2014,7(03):105+104.

姓名:吴庆升(1983111日 );性别:男,籍贯:云南腾冲,民族:汉族,学历:本科,毕业于云南民族大学;现有职称:工程师;研究方向:信息机房,大数据,新能源

邮寄地址及邮编:云南省德宏州芒市阔时路96号德宏供电局,夺实祥伟收 678400,电话:13628820417