今天的网络可靠性
随着现代企业信息化的迅猛发展,企业内部各种业务流程的网上运行,企业的核心业务对数据网络的依靠性越来越强,网络已经成为现代企业核心竞争力的一部分,它的可靠性问题也变得越来越突出,成为用户关注的突出问题。网络可靠性的目标是实现业务数据流的无中断转发,而网络的可靠性取决于组网设备本身的可靠性和组网架构的可靠性。
设备的可靠性
设备的可靠性主要取决于设备自身软件和硬件的设计水平。在网络设计中,核心设备必须具备可靠性已经得到了用户和厂家的充分认可,因此大都选取了具有高可靠性的机架式交换机,同时还配有双电源、双主控板之类。而边缘交换机更看中接入能力,考虑到成本等问题,可靠性设计上往往比核心设备稍逊一筹。
组网架构的可靠性
不管在什么时候,最好的可靠性方式始终是冗余。在今天的组网方式中,冗余方式包含设备冗余和链路冗余,其中,设备冗余技术上则体现为VRPP和STP/RSTP/MSTP,链路冗余在技术上体现为STP/RSTP/MSTP(后面统称为STP)、LACP。
VRRP技术可以实现两个中心交换机在第三层的热备份功能,保证了当某一台中心交换机出现故障时另一台可以取而带之。STP技术本来是为了解决桥接环路的问题,但其也可以实现多台交换机在2层链路上的热备份,当主线路出现故障时,备份线路可以马上启用,对业务不会产生大的影响。而LACP本来是解决两台交换机间的带宽问题的,是用来将多条链路绑在一起作为一个逻辑链路使用的技术,但在客观上也起到了链路备份的作用。
这几种技术在现在企业组网环境中的组合应用,应该说基本上已经可以满足大多数用户的需求了。但这仍然不是完美的。
今天组网方式在可靠性上存在的不足
技术本身问题
通过VRRP和STP的技术虽然可以满足了大多数情况下可靠性的要求,但其还是有着一定缺陷的。这主要是因为这些技术实现里并没有把互备的设备作为一个整体来考虑,而是融入主备的概念,是一种主动/被动方式,其过分强调了冗余,因此在负载分担上出现了不足之处,当然,这也降低了投资效率。
首先在VRRP技术中,参与VRRP的每台设备的所有网络功能都是独立运行的。只是在作某一VLAN的网关时分为一主一备,正常状况下只有主设备为该VLAN的数据提供转发服务,而备份设备完全是处于闲置状态。造成了备份设备的极大浪费。对于这个问题,现有解决方案是通过规划,将不同的VLAN网关指向不同的中心设备,比如中心交换机A和B作VRRP,其中A充当VLAN1的主网关,B则当VLAN1的备份网关,对VLAN2而言,则B是主网关,A是备份网关。这样就人为的将数据流分散到两台中心交换机上,实现负载分担。当然,这种分担方式的弊端显而易见,且不说其前提必须存在多VLAN情况下才能起作用,即使有多VLAN,每个VLAN的数据流大小也各不相同,对中心交换机造成的压力也完全不平衡。
STP也存在同样的问题,正常情况下只有主链路在传输数据,备份链路也是完全闲置,根本起不到负载分担的作用。
而LACP虽然可以起到负载分担的作用,但其多物理链路连接的同一端只能是同一台交换机,这样只能实现链路负载分担而不是设备负载分担,而且设备本身也会形成单点故障。
复杂度问题
由于VRRP、STP等技术都需要对网络结构做较好的规划,并且在实现上需要用户对多台设备进行配置,这些都增加了组网的复杂程度。对今后网络的日常维护也会带来不利的影响。
IRF技术针对可靠性的解决方案
IRF技术介绍
IRF的含义就是智能弹性架构(Intelligent Resilient Framework),是一套全新的软件解决方案,支持IRF的多台设备可以互相连接起来形成一个“联合设备”,这台“联合设备”称为一个Fabric,而将组成Fabric的每个设备称为一个Unit。多个Unit组成Fabric后,无论在治理还是在使用上,就成为了一个整体。它既可以随时通过增加Unit来扩展设备的端口数量和交换能力;同时也可以通过多台Unit之间的互相备份增强设备的可靠性;并且整个Fabric作为一台设备进行治理,用户治理起来也非常方便。
简单来说,就是IRF设备通过多个Unit的互连形成了用户迫切需要的易治理、易扩展以及高可靠的产品特点,是一种不同于业界现有设备的全新理念的网络设备。
IRF技术主要由3个部分组成:
l 分布式设备治理(DDM):是IRF技术的控制系统,负责向IRF分布式交换架构发布各类治理和控制信息。
l 分布式弹性路由(DRR):它使一个IRF分布式交换架构中多台互联在一起的交换机像一个统一的主动路由实体一样工作,并能在所有交换机中智能地分配路由负载,使网络的路由性能实现最大化。
l 分布式链路聚合(DLA):它能实现网络核心设备与网络边缘设备的全网状互联。
IRF具有高可用性、高性能、易治理、优化IT预算等优点。除此之外,支持IRF技术的交换机可以与企业现有的不支持IRF技术的交换机实现互操作。尽管不支持IRF技术的交换机将不会成为IRF分布式交换中心的组成部分,但是,这些交换机仍然可以通过链路汇聚技术、生成树协议或者链路冗余技术被当作独立的整体加以治理,冗余配置仍然有效。
IRF技术能够构建具备高可用性和可伸缩性的网络核心,其性能、配置能力和可伸缩性都能与网络同步增长,从而避免集中式网络核心设备需要面对一次性较大投入和物理限制等问题。因此,IRF技术能通过一种全新的“按需购买,渐进扩展”的策略帮助企业降低网络总体拥有成本。
IRF技术充分体现了分布和集中的有机结合。组成Fabric的各成员在二三层数据转发、二层协议和路由状态上都是独立自主的进行处理。这些为可靠性和整体性能都带来了莫大的好处。而对外界而言,各成员又抱成一团,不管是在路由协议、三层报文的转发,还是治理上,都表现为一台设备,共同拥有一个ip地址,集中进行配置、集中的日志输出。
IRF组网方案
组网示意图
图一 IRF整网解决方案
图一为IRF的整网解决方案示意图。所有交换机都为支持IRF功能的交换机。其中两台核心交换机、服务器接入交换机、汇聚层交换机和接入层交换机都为IRF架构,各层次之间通过双回归链路进行连接。
单从图上看,IRF组网与传统方式的组网在拓扑上似乎并没有什么太大的差别,顶多就是各层次间多了些连线而已。但正是这些看似复杂的连线,将网络的可靠性、整体转发性能提到了一个新的层次,但在治理上却比传统网络更为简单。
在图一中,IRF组网方式中不同层次的网络设备间都采用了双回归方式的链路连接,虽然物理连线比较多,但按照IRF的DLA技术组成了LACP组,使得IRF构架的网络在提高网络整体转发能力的同时保障了网络的可靠性。并且在将来随着业务的发展,完全可以在各IRF Fabric中继续添加新的IRF交换机,从而使网络核心和边缘都可以根据需要不断提高性能。这也是业界里第一个通过一种技术就能够同时对网络的可靠性、可扩展性和网络性能各方面都大有裨益的组网方式。
DLA(分布式链路聚合)的连接不但保障了线路没有单点故障,而且答应LACP的一端连接在Fabric中不同的物理单元上,这也避免了设备单点故障引起链路全部中断的风险,而且还能够充分发挥LACP的链路负载均衡优势。
好的网络治理有助于及时发现网络问题。在网络的可治理性方面,IRF交换机组网具备有天生的无可比拟的优势。其DDM(分布式设备治理)特点将分布与集中有机的结合在一起,将各个独立的IRF交换机组成的Fabric当作一台设备来进行集中式统一治理。不管是通过网管软件、WEB还是TELNET、控制端口等方式进行治理,对外而言,看到的就是一台设备,进行配置时,也只需对Fabric进行配置即可,而不必对每台设备进行单独的配置,如图二所示。同时,Fabric也有集中统一的日志输出。所以在逻辑上和网管视图上,图一中各网络层次都只有一台交换机,如图三所示,大大简化了治理界面。而且每个Fabric都仅需一个治理IP地址。实际上,即使通过每个Fabric中不同Unit的控制口进行治理,看到的也都是同一台设备的治理界面。毫无疑问,在这种方式下,不但网络的拓扑结构大大简化,而且需要配置的设备数量也大大减少。这不管是对于网络初期的安装还是日后的维护,都带来了巨大的好处。
图二 分布构架,集中治理
图三 IRF整网解决方案治理视图
在有着更高可靠性的同时,相对于传统的组网方式,IRF组网技术有着明显的成本优势,其组网原则就是“渐进扩展,按需购买”。由于IRF Fabric中Unit的增加可以提高Fabric的整体数据转发能力,因此在用户组网初期,完全不必考虑到将来发展等因素而去购买昂贵的远超目前需求的核心交换机设备。而可以选用支持IRF的核心交换机,将来业务发展需要扩充性能时,则可以动态地加入新的IRF交换机设备,共同组成Fabric来提高整体性能。而IRF技术答应每个Fabric中的Unit都可以动态加入和撤离(类似于机架式交换机的热插拔),因此完全能够实现网络的无缝升级。这种只需为眼前的需求买单的组网技术必将为用户节省大量的设备投资。
IRF组网带来的高可靠性优势
组网架构的可靠性
IRF的分布式组网方式正所谓“不要把所有鸡蛋放在一个篮子里”一样,分布式特征答应设备分布在不同的物理位置上,消除了物理损害引起的致命性故障。
相对VRRP、STP等技术而言,IRF交换机的构架在可靠性上具有先天优势。要害点在于IRF技术本身是着眼于多台IRF交换机组合后的有机整体上,因此在采用IRF组网方式时,中心不在存在原VRRP组网时出现的负载分担不均衡问题。而中心和边缘也就相当与两台交换机的互连,不存在哪一条链路因为STP而阻断的现象,而由于DLA的应用,LACP的同一端物理上可以连接在不同的交换机上,逻辑上却仍然是一个整体,因此不但避免了设备的单点故障,而且充分发挥了LACP负载均衡的优势。
IRF Fabric内所有单元都参与业务的运行,共同分担负载。一旦某台设备出现故障,其上的负荷将被其他单元接过去,而不会影响业务的正常运转。同以往的1+1、N+1冗余机制相比,IRF在数据转发处理上不分主备,都是主,也都是备,是一种1:N的冗余机制。
数据转发的可靠性
IRF支持的分布式数据转发可以将网络负担分配到Fabric中的每个单元上,各单元独立完成转发工作。配合DLA技术,则数据的转发不会因为设备或链路的单点故障而受影响。
(1)分布式的二层转发
在IRF Fabric中,各单元的mac表项由每台设备独立学习,并且可以进行远程学习, 报文可以直接由接收设备通过内部互连链路转发到其他单元上。当某个设备故障后,通过内部消息处理,各其他单元上所有与故障设备相关的表项都会被删除,可避免报文不会被转发到一个错误目的地址。
(2)分布式的三层转发
在IRF Fabric中,各单元的三层表项由接收设备学习并通过内部通道同步到Fabric中的其他设备上,而当某个表项发生变化时,Fabric内其他设备都会马上刷新表项。因此每个单元都可按照各自的三层FIB表来进行数据转发。对于三层数据报文而言,整个Fabric作为一个整体,不论报文穿过了多少个Fabric内部单元,在跳数上只增加1。
路由状态的可靠性
网络可靠性的目标就是实现业务数据流的不中断转发。要实现这一点,除了2层的技术支持,3层路由的倒换更是技术难点。传统的VRRP技术在实现上,将设备分成了主备,没有形成一个整体,而对用户虽然提供了一个虚拟的网关地址,但这个地址是要在两台设备间进行切换的,在切换过程中都会出现业务数据流的中断现象。
IRF技术很好的解决了这个问题。由于IRF技术将Fabric中多台设备作为一个整体来考虑,不存在主备路由切换的问题。在技术上实现了“路由协议热备份”,做到了同一个Fabric中各个Unit上路由信息的严格同步,并且在其中一个或多个Unit出现故障的时候,其它Unit可以照常运行并迅速接管故障Unit的功能,此时,域内路由协议不会随之出现中断,二三层转发流量和业务也不会出现中断,从而实现了真正意义上的不中断路由协议、不中断业务的故障保护和设备切换功能。对用户而言,整个IRF Fabric作为一台设备治理所有的三层接口、进行路由协议的配置并且运行路由协议。
降低了投资成本
由于IRF交换机组网的分布式转发特性,两台与传统交换机同性能的IRF交换机组成的Fabric的转发能力为各设备的累计和,这是传统传统交换机无法做到的。而由于可靠性的考虑,通常都要采用两台或多台设备进行设备冗余。而IRF的出色之处就在于在保证可靠性的同时,还大大提高了Fabric的整体性能,使的IRF Fabric的可靠性和高性能有机的结合在一起,而不是象传统方式那样把可靠性和高性能分开实现。这样在组网时,不必要追求过高的设备性能,从而节省了组网成本。
另外,因为IRF设备构成的架构可以逐步添加,这意味着IRF Fabric的性能也可以逐步提高,这些都为那些因为资源紧张,无法在初期作较大投入的企业的组网提供了新的选择,可以采取“按需购买,渐进扩展”的原则来扩充网络。