从结构上看,刀片服务器只是由多个“卡片式”的服务器单元与一个机架式的机箱组成的一个高密度服务器群。与传统的机架式服务器或塔式服务器相比,刀片服务器的每一个服务器单元都包含独立的CPU、硬盘、内存、网络接口等器件,而机箱则为多个服务器单元提供共享的基础设施。正是这一巧妙的设计,使这个服务器家族新兴成员迅速成长为服务器市场的主力军。从2000年诞生至今,刀片服务器的配置已经从原本单路CPU发展为从单路到8路的刀片服务器系列,能够满足从普通的打印服务器到大运算量的数据中心服务器等不同级别的运算要求。根据IDC的调查报告,2005年刀片服务器的出货量比上年增长了49.3%,被使用的比例是传统机架式服务器的2.5倍。如此可见,刀片服务器已经赢得了市场的普遍认可,并且正在逐渐发展成为企业级数据中心平台的重要组成部分。
一、刀片服务器使用背景
作为辽宁移动运营网络的建设和维护部门,辽宁移动网管中心管理支撑着辽宁省内全部的运营网络,按照维护工作的分工,具体划分为交换网络维护、传输网络维护、数据网维护、网络优化以及IT支撑网维护。随着各专业维护管理工作的不断深入和细化,近年来各种支撑维护系统陆续投入使用,各专业的信息化程度不断提高,IT支撑系统的建设规模不断扩大,辽宁移动网管系统建设决策者们也同样面临着诸多难题。
(1)IT系统的投资在不断增加,如何控制投资、减少投资成为系统建设者面临的首要问题。
(2)随着设备数目的不断增加,机柜的数目不断增加,机房内网络布线也在日益变得混乱,机房的UPS系统也正在接受考验。
(3)为了保证各专业IT支撑系统稳定运行,寻找一个能够易于管理、出现故障时能够快速恢复的支撑平台被提上重要日程。
(4)随着新系统的建设,IT系统管理员频繁在各种平台中间周旋,人手短缺,疲于奔命,管理员有条不紊的开展工作显得尤为重要。
(5)为了满足新业务的快速投入使用,需要寻找一个能够快速,大范围部署的支撑平台。
解决上述问题成为在网络规模不断扩大的同时而继续保障IT支撑系统稳定高效运行的首要考虑。辽宁移动网管中心经过与厂家交流以及对现有技术的评估,最后决策者将解决现有问题的希望锁定在刀片服务器上。
刀片服务器确实有吸引人的独特优点:
(1)能够有效地降低投资。与购买机架式服务器相比较,可以节省一定的购买成本,因为购买机架的原因会导致成本偏高。刀片服务器是共享机架提供的基础设施,因此在后续购买刀片服务器时,自然会节省部分投资,综合来看。刀片服务器相对于传统的机架式服务器具有一定的成本优势。
(2)解决网络布线混乱的问题,同时也能在一定程度上缓解UPS的压力。刀片服务器依靠机架提供的网络交换机与外部互连,减少了因增加主机而铺设网线的需要,同时因为刀片服务器共享机架电源,可减少电源线的连接。
(3)能够适应新业务快速部署的需要,满足出现故障时快速恢复的需要。现有的刀片服务器厂家在部署服务器系统时,都提供自动部署系统的工具,在有新业务需要投入使用时,只需插入一块刀片,部署应用系统即可。这样免去了传统的需要铺设线路,安装服务器等前期工作,一定程度上加快了业务应用的部署。另外,大多数服务器厂家都提供快速故障恢复工具,通过管理工具自动发现系统故障,切换到备份服务器以及根据计划快速恢复出现故障的服务器。
(4)有效缓解机房空间紧张的情况。刀片服务器设计的高密度,使同样大小的机柜空间能够容纳更多的设备,缓解了机房空间紧张的状况。
经过多方论证,2004年,辽宁网管系统三期项目建设中,我们把刀片服务器作为对运算能力要求不高的应用系统首选平台,这些应用系统包括Web服务器、远程登录服务器、EAI服务器等。本次引入了两组共16片刀片服务器,服务器型号为HP的BL20P G2,每片服务器的具体配置为两颗CPU,2G内存。经过一段时间的运行,该BL20P型号的服务器完全能够满足Web网站的运算要求,部署在其上的其他系统,例如远程登录服务器(Citrix Presentation server)、EAI服务器(Biztalk2004应用服务器),运算节本正常。可以说,此次刀片服务器的引入相当成功。
通过前期引入刀片的成功探索以及通过对其他厂家刀片服务器的了解,在2005年集中操作维护系统项目建设中,考虑到集中操作维护系统的对运算能力的要求,辽宁移动网管中心引入了一组DELL公司的PowerEdge1855,共10片,每片服务器的配置为两颗CPU,2G内存。经过一段时间的试运行,最后辽宁移动网管中心决定将运行在高性能机架式服务器的企业核心Web应用全部迁移到DELL的刀片服务器上。
二、刀片服务器存在的问题
通过对两个厂家刀片服务器的使用,我们也总结出刀片服务器目前存在的一些问题:
(1)两个厂家的刀片服务器使用自己的设计标准,他们的机架尺寸、刀片尺寸、配件类型完全不同,相互之间不兼容,导致刀片服务器的配件不能通用,这使得我们只能依赖单一厂家。
虽然,2004年IBM与Intel公开了刀片服务器的设计规范,刀片服务器的标准化提上日程,但HP公司的发言人称,标准的统一至少需要五年。更有悲观者认为,刀片服务器标准的统一可能性为零,看上去这种标准的统一还需要很长的路要走。
(2)两个厂家使用不同的管理工具管理自己的刀片服务器,HP使用Insight Manager以及通过ILO来管理刀片服务器;而DELL使用OpenManage以及DRAC/MC管理模块来管理刀片服务器,相互之间不能通用。
对于软件部署方面,虽然双方都使用Altiris作为分发部署软件,但是两个厂家都与自己的管理软件做了绑定。值得一提的是,HP公司要求作为分发部署的服务器必须是HP的服务器,这些内容都给系统管理员造成了一定的麻烦。他们不得不熟悉每一种产品,要拿出更多的时间用来学习完成相同功能的多种技术,一定程度上造成了人力资源的浪费。
三、网管系统基于刀片服务器的应用
经过一年多来对刀片服务器的调整,目前在辽宁移动网管系统中,很多的应用系统运行在刀片服务器上。
(1)网管系统门户
使用基于Microsoft Sharepoint Portal Server 2003建设的门户系统,为内部员工提供一个强大的团队协作环境,公司员工使用此门户来进行文档发布息,相互协作和进行内部搜索。系统建设使用7片HP BL20P刀片服务器,其中:四片用作Web前端服务器,使用NLB集群方式为用户提供访问接入;两片用做搜索服务器,按照我们预先设置的内容源(包括我们的Exchange共享文件夹资料,员工投放的文档等内容),进行爬网以及根据用户输入的内容进行搜索;一片用作索引服务器,用来完成对搜索到的内容编制索引。
到目前为止,该门户系统的访问量已经达到38万次,通过该门户提供的搜索引擎,员工可以在企业内搜索自己想要寻找的内容;该搜索引擎已经索引的文档数量达到16个。网管系统门户已经成为日常工作中很重要的一部分。
(2)企业EAI系统
EAI即企业应用整合,是企业为了要将内部以至外部各独立的系统整合起来,解读并转换来自不同系统间不同应用程序的数据,它使用用户定义的流程整合这些应用程序间的协同运作,提供了数据格式转换,同步或异步的自动流程处理。
为满足不同业务需要,辽宁移动网管中心内部已经建立很多的IT支撑子系统,因为建设的时间和侧重点不同。这些系统只作为一个独立的系统在运行,通过使用Microsoft的Biztalk2004软件,开发对应的适配器(adapter)处理不同应用程序数据(消息)以及建立相应的流程和规则来处理消息和协调不同应用程序,达到将不同的IT支撑子系统整合起来的目的,建立一个动态的,跨应用、跨平台、跨业务的业务流程。
目前EAI系统中使用两片HP BL20P作为Biztalk应用服务器,已经部署了12个流程,主要整合的子系统包括Temip告警系统、IP网管系统、Servicedesk工单系统、大屏幕显示系统、故障通知系统、故障上报系统,EAI系统每天处理的消息数达到15万左右。
(3)集中操作维护系统
目前交换网络中共有192个网元,维护人员可以登录这些网元进行维护操作,为了加强对这些网元的访问控制,保证网元的稳定工作,开发了集中操作维护系统。通过此系统,维护人员可以不必了解网元上的账户,直接使用网管系统中邮件账户,登录集中操作维护系统,通过此系统操作对应的网元,目前该系统安装在两台Dell刀片上,使用NLB集群的方式为用户提供服务。
(4)网管系统WWW网站
网管系统WWW网站,部署在三台Dell刀片上,使用NLB集群方式为全省人员提供Web服务,所承载的应用包括辽宁移动的话务分析系统网站(用来提供各种话务系统相关报表),局数据核查系统(供局数据制作人员进行核查),知识管理系统(为建设学习型组织建立的系统),日常办公系统以及部署网管系统中完成特定功能开发的WebService组件等。
经过将近两年来对刀片服务器的使用,我们发现,通过使用刀片服务器确实能在部署、维护和管理方面给我们带来很大的方便。快速的故障恢复能力使我们相信,刀片服务器同样具有很高的可用性。下一步,我们将根据我们的应用系统特点,结合我们的业务需要,逐步将更高端高性能的刀片服务器引入到对运算能力要求较高的企业后端应用系统中,充分发挥刀片服务器的特点,向着建设一流网管系统目标前进。