对于企业来说,提高IT效率的重要性不言而喻,所以引进一套支持运维人员工作效率的软件非常重要,正如用CRM提高销售人员的工作效率、用ERP提高整个制造过程的工作效率一样。关于网管软件的设计思想,我们 可以从技术和应用的角度来探讨。
(一)从技术层面看
现在市场上可供选择的网管软件非常多,但真正满足大中型企业治理需求、成熟专业的网管软件,国内只有可数的几家厂商可以提供。从技术层面讲,虽然网管软件实现的方法不一定相同,但殊途同归,成熟的网管软件一般都具备数据采集、基础子系统、配置子系统、扩展接口子系统等组成部分,可提供开放的API接口和友好的二次开发界面,能很好地满足用户个性化系统治理的需求。
以上海网强的NtSrong网管软件为例,它的核心设计思想是通过模拟系统治理人员的日常操作,对整个系统的运行状况进行7X24的实时监测和治理。它通过一台安装在Windows环境下的监测主机,采用主动和被动的轮循方式采集整个信息平台及其应用的要害数据,将数据实时的通过监测主机的报告和控制中心进行处理,通过十分友好的浏览器界面将整个系统的运行状况一目了然的显示出来,并提供完善的报警和报告功能。
(工作原理图)
(二)从应用层面看
网管软件是网络治理人员最为实用的工具,“工欲善其事,必先利其器”。网管人员有了一个合适、易用的治理工具,就如财务人员有了帐务系统、销售人员有了CRM一样,摆脱了传统、手工的工作方式,利用现代化的高科技软件,大幅度提高工作效率。从应用层面看,网管软件主要体现了以下几个方面优势:
(1)网络监管自动化
网络监管自动化贯穿于整个系统,是一个非常重要的理念。它源于对软件的理解,软件是支持工作人员行为的工具,是提高工作效率的一种手段。只有最大限度地实现自动化,软件才是一个有效的提高工作效率的手段。比如,人类最初用纸笔、算盘进行计算,之后上升到使用计算器、计算机,真正实现自动化计算,提高了计算的效率。
网管软件的自动化,主要体现在监测、预警和报告的自动化,它们可以对网络设备和服务器及其应用系统提供自动化的集中监测治理。一般来说,成熟、专业的网管软件可以从服务器、网络设备、企业应用、Web应用等各个方面对网络进行全面的自动化监测,从而帮助运维人员提高他们的工作效率。例如,最简单的“Ping”操作,虽然运维工程师谁都可以通过手工 “ping”来检查网络的连通性。但运维工程师假如天天将大量的时间花在简单而重复的“ping”操作上显然是不现实、不合理的。实际情况往往是公司内外用户发现问题后,运维工程师通过“ping”来查找线路问题,这样企业的QoS自然得不到保障。而所有这些工作完全可以使用自动化的工具来替代。系统治理人员只要设置好 “Ping”监测器,就可以放心地去做其它事情,一旦任意线路出现故障,警报系统将及时通过短信息、E-mail等各种方式提醒相关运维人员,从而帮助运维工程师在用户发现问题前使问题得以解决。“Ping”监测是最基本的监测器,成熟的网管软件当然还包括许多复杂的监测器,如数据库监测、业务流程的监测等等。组合使用它们就可以实现对整个系统的自动化监测治理。
(2)复杂工作简单化
网管软件在实现高度自动化的同时,也使复杂的工作实现了简单化。如,需要了解数据库的可用性,这个操作就比较复杂,但有了自动化的工具后就变得非常简单了,不一定需要一个很资深的工程师来执行这个操作,一个非技术人员就可以胜任这个工作。因为,他只需要查看监测组或网络应用拓扑图上颜色的变化就可以知道数据库是否在正常工作了。
比如,开车的人只需要看仪表盘就可以了,不需要对汽车的运行原理很了解。他不需要去把车厢盖打开查看油箱在哪里、或水箱在哪里,然后再查看油箱、水箱的状况。因为想要知道邮箱有没有油或水,通过仪表盘就可以看到了。同样,网管软件把复杂的工作简单化,不需要网络运维人员逐个操作或查看网络运行状态。
又如,某银行磁盘坏了,很久都没人注重到。直到银行业务数据丢失,经反复查找才发现是磁盘的问题。原来是负责这个工作的刚毕业的大学生对系统操作不熟悉,让他及时发现某个磁盘坏了确实有一定的难度。刚毕业的学生不会那么快就对银行所有的操作系统都熟悉,它需要一个过程,即使是一个资深的工程师,面对不同的操作系统执行不同的指令时也是很谨慎的。
而使用网管软件就不会存在这些问题,它可以7X24自动监测各种操作系统服务器的运行状况,再初级的系统治理人员也可以从某个监测参数颜色的变化中了解可能出现了问题。它还可以将资深系统工程师对各种故障的判定和处理知识写进系统中,形成治理知识库,帮助把复杂的系统治理工作简单化、标准化。
(3)工作流程标准化
在我们的日常工作中,很多信息都存储在每个人的脑子里。工作流程标准化,主要指通过网管软件实现信息的共享。 比如,在实现工作流程标准化之前,网络监测的方式存储在运维人员的脑袋里。某个应用监测的方式,最初是开发人员知道怎么操作,之后他们会传授给银行的运维人员,银行的开发人员监测这个进程,或监测那个日志之后就达到目的了,这种现场指导的方式,并没有形成任何可以留存的文档。这样就轻易形成信息孤岛,系统该怎么监测、哪些应用需要监测等信息,只有负责这些工作的运维工程师知道。而使用网管软件后,就可以把这些监测流程固化进来,一方面实现信息共享,另一方面监测流程、故障处理流程都标准化了,只有这样系统运维人员才可能对企业的要害QoS提供有力的保障。