当前,企业的IT 应用日益繁多,IT 运维管理人员根据以往的技术所能提供的网络环境越来越不能满足业务部门的需求,而统一的管理平台就成当前的一种需求。
在高科技迅猛发展的时代,IT在各行各业所占据的位置越来越重要,大部分业务流程越来越依赖IT提高效率,IT维护人员需要时刻保障业务处理平台高效、安全、正常的运行,为大家日常办公、业务处理提供有力的支撑。但是随着业务不断变化,IT设备日益复杂,IT应用日益繁多,IT运维管理人员根据以往的技术所能提供的网络环境越来越不能满足业务部门的需求,从而引发了IT服务与实际业务需求脱钩,如何消除鸿沟、实现IT与业务的融合,成为众多IT运维管理人员及CIO最为头疼的事情。
IT服务管理平台的起源
为了对IT服务进行良好的管理,面向IT服务的管理挑战与需求——IT服务管理应运而生。IT服务管理是立足于服务,建立以客户为中心,以流程为导向,从业务角度出发的一种全新的IT管理模式。通过整合IT服务与业务,提高IT部门提供IT服务的能力,保障“系统不瘫、网络不断、数据不丢”,从而帮助用户最终实现IT与业务的融合,不断提高业务部门和客户的满意度,提高用户的核心竞争能力。
提到IT 服务管理就得说到ITIL。ITIL是IT Infrastructure Library的简称,最早是英国政府中央计算机与电信管理中心(CCTA)在20世纪90年代初期发布的一套IT服务管理最佳实践指南,旨在解决IT服务质量不佳的情况。2004年“指南”被引入中国,国内对它的认知、重视程度持续提升,ITIL已经成为ISO2000的标准之一,ITIL是实用的方法论,能真正有效的提升IT管理水平。
ITIL强调以客户为中心、以流程为导向,经过多年的发展与完善,已经成为IT服务管理领域的事实标准和最佳实践。ITIL规范主要包括服务支持(Service Support)和服务交付(Service Delivery)两部分。服务支持由服务台、事件管理(突发故障管理)、问题管理、变更管理、发布管理、配置管理功能模块组成,并结合服务水平管理,属于运营范围,是信息部门日常运维的基础。它保证了IT基础设施的可控性和稳定性,使企业快速适应不断变化的业务环境。服务交付包括服务级别管理、服务容量管理、可用性管理、IT服务连续性管理、IT财务管理等流程,需要在服务支持基础上才能进一步实施,更具战略规划性。
ITIL定义了企业IT系统计划、研发、实施到运维的最佳实现流程和管理原则。这些流程和原则可以通过规章制度的方式定义和实现,但通常需要借助一些工具软件帮助其落实。
IT服务管理平台架构建设IT运维管理系统的总体目标是建立一个稳定、高效,灵活的信息系统运行和维护管理体系,为业务系统正常运行提供有力的支撑,提高信息系统运行效率,提高服务质量,降低运营的成本,为实现的战略目标提供坚实的基础支撑。
IT服务管理平台应该由底层资源监控子系统、统一事件平台子系统、统一资源库子系统、统一展现子系统、IT服务流程管理子系统等组成。
底层资源监控子系统负责实现对网络设备与链路、服务器、数据库、中间件、存储系统、安全设备、业务应用的运行状态监控、数据采集与分析等功能,并将采集到的数据送达统一事件平台与统一资源库子系统。
其中,统一事件平台子系统负责实现对来自底层监控平台的各类告警事件的识别、规整、过滤、压缩、关联、告警等处理功能,并将处理后的数据送服务流程子系统、统一资源库子系统。
而统一资源库子系统负责资源存储空间的建模、数据组织与关联、数据的存取与统计分析,及资产的生命周期的管理等功能。
统一展现子系统从统一资源库(配置数据、状况数据、当前与历史运维数据、当前与历史性能数据)等中读取数据,实现个性化的数据呈现。服务流程子系统实现ITIL规范所要求的相关流程管理。
整个技术平台需以统一资源库子系统为核心,统一资源库能够自动实时地同步底层资源监控子系统所采集到的配置、状态等数据,并自动实现统一资源库中资源配置数据与实际运行环境中资源配置的比对和校验;统一展现平台与服务流程子系统需支持与统一资源库的无缝联接,可以从运行展现图上直接查阅相关资源详细的配置数据数据;统一事件平台需支持从统一资源库从读取资源关联信息,为事件压缩、关联提供依据。
图Broadview IT运维管理平台模拟场景
以一个简单的用户现场看,用户已经部署了全网监管系统、防火墙管控系统、安全管理系统、补丁管理系统、机房环境系统等底层资源监控系统,并在实际工作中取得了一定的实效,但现实工作中还存在不少问题。
第一,信息安全值班方面,存在用户的监控记录纸质登记,尚未电子化,且与相关联的各服务器之间并无关联;交接和审核流程尚未电子化;故障处理日志,与发生故障的设备等无关联;尚未形成知识库;应用系统备份,目前采用人工方式等问题。
第二,前端日常维护方面,存在用户报修与固定资产没有对应关系;用户报修与客户机资料之间没有有效的对应;处理过程的积累、知识库的积累没有有效的机制;日常用户报修和领导交办工作无法实现量化考核等问题。
第三,资产管理方面,存在固定资产与设备采购信息等无关联;固定资产无电子记录;送修、报废信息无体现等问题。
第四,服务器管理方面,由于是纸质登记,更新(硬件配置调整、应用变化等)比较繁琐,不利于及时跟踪;无法完全体现服务器的完整信息,与IP管理、防火墙端口管理、综合布线、故障管理、维护日志、信息安全值班、系统备份、定期的安全加固、渗透测试等衔接较欠缺;技术文档、配置文档更新较为繁琐、存在重复工作。
第五,客户机资料管理方面,一直沿用纸质登记,更新(硬件配置调整、应用变化等)比较繁琐,不利于及时跟踪;无法完全体现客户机的完整信息,与固定资产管理、IP管理、综合布线、日常报修等衔接较欠缺。
第六,综合布线方面,由于是纸质管理,更新较为繁琐;管理不够直观、简便,查询复杂;综合布线调整目前无工作流程;与防火墙、路由器、交换机、配线架等的对应关系不够清晰。
第七,防火墙等安全设备、路由器等网络设备方面,一直是纸质管理,更新较为繁琐;技术文档、配置文档更新较为繁琐、存在重复工作;防火墙规则与各有关设备信息之间的关联度不够;与资产管理、采购合同无关联。
第八,全网监控方面,缺乏日志和分析报表与运维平台的整合,运维平台对相关数据的综合分析等。
平台部署的目标分析通过部署IT运维管理平台,企业可以实现这样的目标。
第一,梳理各类资源的管理内容及相互间的关联关系,建设高可用的统一资源库;实现统一资源库与全网管理系统的衔接,网元层面的资源配置数据的实现了自动采集、比对与同步;实现了与服务流程子系统的衔接,实现资源生命周期的全程管理,从流程上保证各项资源信息的准确性。
第二,通过ITIL流程的实践,提高了日常运维管理工作的规范性。同时也量化了IT系统的运行质量,为评估和持续提升运维水平提供了依据和手段;
第三,通过统一事件平台,实现对全网管控系统、安全管理系统、机房环境系统、桌面管理系统等监控工具告警信息的集中采集与处理,实现对各类资源日常运行值班的集中化和自动化,有效降低系统管理员的工作负荷。