摘要
OAM功能在公众电信网中十分重要,它可以简化网络操作,检验网络性能和降低网络运行成本。在提供保障服务质量的网络中,OAM功能尤为重要。传统的SDH/SONET和ATM中都定义了相应的OAM功能,MPLS作为可扩展的下一代网络的要害承功技术,提供具有Qos保障的多业务能力,因此MPLS网络迫切需要具备OAM能力。文章从MPLS OAM的功能要求入手,以故障检测技术、保护恢复技术、网络优化和网络治理等为分类标准,对目前几个标准体中推荐的几种MPLS OAM技术进行深入介绍和对比分析。
根据运营商网络运营的实际需要,通常将网络的治理工作划分为3大类:操作(Operation)、治理(Administration)、维护(Maintenance),简称OAM。操作主要完成日常网络和业务进行的分析、猜测、规划和配置工作;维护主要是对网络及其业务的测试和故障治理等进行的日常操作活动。
ITU-T对OAM功能进行了定义:1)性能监控并产生维护信息,根据这些信息评估网络的稳定性;2)通过定期查询的方式检测网络故障,产生各种维护和告警信息;3)通过调度或者切换到其它的实体,旁路失效实体,保证网络的正常运行;4)将故障信息传递给治理实体。
OAM功能在公众网中十分重要,它可以简化网络操作,检验网络性能和降低网络运行的成本。在提供保障服务质量的网络中,OAM功能尤为重要。传统的SDH/SONET和ATM中都定义了相应的OAM功能,MPLS作为可扩展的下一代网络的要害承载技术,提供具有Qos保障的多业务能力,因而,MPLS网络的迫切需要具备OAM能力。OAM机制不仅要预防网络故障的发生,而且需要实现对网络故障的迅速诊断和定位,最终提高网络的可用性和对用户的服务质量。
一、技术发展现状
MPLSOAM技术目前还处于初始的发展阶段,只形成了少量建议、标准和一些草案。ITU-T在建议Y.170即《用于MPLS网络的OAM功能总体要求》中描述了MPLS网络中用户平面OAM功能的驱动因素和基本要求(用户平面指用户数据流经过一系列流量转发实体)。为了保障MPLS网络的可靠性及性能,运营商迫切需要在MPLS网络中加入OAM功能。
二、MPLSOAM功能要求
MPLS引入了全新的网络架构,其相应的网络故障具有MPLS层特色,因而,位于MPLS以上或者以下的网络层的OAM功能无法满足MPLSOAM的非凡需要。对MPLSOAM功能的要求源自于其推动因素,一般来说MPLSOAM主要完成以下一些功能。
1.OAM功能检测到路径失效或者中断时,及时发现故障、发出告警信号、诊断、定位故障,并采取适当的恢复措施,减少故障引起用户数据传输中断的时间。
2.AM功能应同时适应于永久连接和按需建立的连接。
3.特定网络层中的故障不应引起多层的连锁反应,避免客户层(即IP层)采取不必要措施。
4.在大型网络中OAM机制运行必须稳定。
5.手工激活或者配置MPLSOAM的工作量必须最小化,以满足大型网络中大量LSP OAM需要。
6.MPLSOAM对运营商来说应具有足够的灵活性,运营商可以自主决定在特定LSP上使用特定OAM功能。
7.MPLS OAM功能必须是后向兼容的,即对于不支持该功能的标签交换路由器(LSR),自动丢弃OAM信息,不影响用户的数据或者采取不正常措施。
8.具有测量单个LSP可用性和QoS的能力。
9.MPLSOAM功能独立于下层承载网络和上层业务,不影响原有上下层网络和业务的正常运行。
10.MPLS用户层OAM和控制层OAM功能相辅相成,缺一不可。
11.对各种故障的类型要有明确的定义和可量化的尺度,明确与定义及故障类型相对应的各种措施。至少应实现以下几种MPLS用户平面故障的检测:LSP连接中断或者失效;LSP误合并(包括环回情况);非受控组播。
12.OAM分组必须具有纠错机制,抗线路误码。
三、MPLS OAM技术
实现OAM功能可以有几种方式,第一种是定义专用的OAM标签进行网络性能监控,故障告警,类似于ATM中的信元和SDH中的开销;第二种使用类似于传统IP网络中的ping和Traceroute等工具。此外,还包括故障恢复机制,网络优化机制和网络治理的功能。
1.故障检测技术
1)MPLS ping
MPLS ping是一种检测MPLS LSP数据平面故障的方法,这个方法简单有效,可以发现一些控制平面无法发现的故障,为用户提供了一种在短时间内发现和隔离路由黑洞或者路由丢失等故障的方法。MPLS ping模拟ICMP echo request和replay,通过ping和TRaceroute发现和定位网络故障。
该解决方案的基本思路是采用属于特定FEC转发类的分组,验证属于该FEC的LSP(从Ingress LSR到Egress LSR)的完整性,在MPLS pingecho请求消息中携带了所属FEC的信息。MPLS ping分组封装在UDP包中,包含序列号和时戳参数。MPLS在处理MPLS ping请求消息时采用了与该FEC分组相同的转发策略。在采用ping进行连通性测试时,分组钭到达LSP的出口,在出口处LSR控制平面对分组进行检查,验证该LSP是否是该FEC的真正出口。Traceroute模式可以作为故障定位的一种手段,发起测试的LSR向目的LSR的控制平面发送Ping分组,该分组的TTL初始值为1步进值为1,这些LSR对该分组执行各种检查,进一步返回相关控制和数据平面的信息。假如ping失败可以采用Traceroute对故障进行定位,也可以通过周期性的Traceroute FEC验证实际数据转发路径和控制平面路径是否一致。但是要注重的是,过于频繁的echo消息会对LSR的控制平面造成很大负载,应慎用。
2)RSVP节点故障检测
资源预留协议(RSVP)“Hello”扩展可以使RSVP节点发现邻近节点是否可达,这种机制提供了节点级的故障检测能力。邻近故障检测是通过收集和存储邻近节点的“Instance”值实现的,假如邻近节点的instant值发生变化或者没有按时发送hello信息,就可以判定该节点重启或者节点间连接发生故障。节点定期向邻近节点发送包含Hello请求目标的Hello消息,产生Hello消息的时间间隔由hello interval参数控制,默认值为5ms。
2.保护恢复技术
1)保护切换
保护切换是ITU-T采用的术语,保护切换技术对于提高MPLS网络的可用性和稳定性具有要害意义。保护切换意味着对受保护LSP路由的预计算和资源的预分配,可以保证在LSP连接失效或者中断后快速重新获得网络资源。目前的技术只能支持点到点的LSP保护切换,可以采用两种保护方式:1+1保护和1:1保护。
1+1保护使用一条专用的备份LSP作为主LSP保护,在IngressLSR处,主LSP和备份LSP桥接在一起,主LSP上的流量复制到备份LSP上,同时传送到Egress LSR,Egress LSR根据故障指示参数的取值,选择接收主备LSP上的流量。
1:1保护时也使用专用的备分LSP作为主LSP的保护,但是主备LSP不同时传送相同的流量,备份LSP在主LSP工作正常的前提下可以传送其它流量,流量的保护切换裁决在Ingress LSR进行。
保护切换发生的前提是:1)由网管发起;2)LSP故障,且配置了备份了LSP。这两种LSP保护切换机制都是基于LSP的,朗讯公司还提出了一种区别于ITU-T,基于分组的1+1路径保护机制,可以做到在保护切换时不丢弃传送中途的用户流量。其原理是在传送的分组中加入序列号,Egress LSR可以根据序列号信息准确地从备份LSP中恢复出主LSP在切换时损失的中途流量。
2)快速重路由
为了满足诸如视频会议电视这类实时应用,有必要对这些流量提供毫秒级的LSP保护切换能力。
上文提到的保护切换技术,需要信令协议的介入,故障点到恢复点的故障指示信令传递引入了不必要的网络恢复延时,快速重路由技术可以实现在没有信令介入的情况下,由故障检测点直接对故障链路流量进行重定向,恢复点即为故障点。多数的快速重路由方案依靠预先建立的备份通道,当网络恢复点检测到网络故障时,要做的工作是简单地更新LSP交换表,使流量从故障端口的LSP切换到预先在正常端口建立的LSP。快速重路由的优势除了可以提高保护恢复的速度外,通过有选择地在网络薄弱环节配置保护能力,避免了因重复保护可靠网络而消耗核心网络资源。在IETF中有多种快速重路由方案,两种主流的保护方式为链路保护和节点保护,其解决问题的思路和复杂度各异,目前该技术还没有形成正式的标准。
3.保护恢复技术对比
快速重路由技术和保护切换技术都可以作为防止链路、节点甚至LSP故障引起丢包,提高网络可用性指标的技术,具体选择何种技术,需要考虑如下因素:1)是否需要预先分配的资源;2)要求的恢复速度;3)配置和信令增加的复杂度;4)数据转发路径长度的变化。
4.网络优化-MPLS流量工程
MPLS TE是一种网络流量优化工具,通过特定的信令协议(RSVP,CR-LDP)协定服务质量等参数,实现人为控制和干预MPLS流量选路,实现网络流量和资源利用优化的目的,MPLS TE的路径选择可以由路由协议根据网络治理人员给出的服务质量参数自动计算出符合条件的路径,或者是网管依据对网络流量信息的可靠了解进行手工选路和配置。MPLS TE赋予网管极大的灵活性,可以对IP/MPLS网络中的流量、流向进行控制和治理,大量的MPLS TE可以加强网络疏通流量的能力,但是假如没有一个高效的治理工具,也会增加网络运营的复杂度。
MPLS TE能有效地处理节点间平行链路的流量分流,通过对LSP带宽参数的控制、LSP和底层链路之间的映射,可以实现对链路资源的优化使用。
在实际网络中可能存在这些需求,将某种类型的流量限制在特定的链路中,或者控制特定流量在选路时忽略某些链路,一个最典型的例子就是对国际链路上流量选路的控制,通过MPLS TE,可以防止非国际业务流占用国际链路的宝贵带宽。MPLS流量工程可以支持LSP的抢占,对于带宽较大的LSP或比较重要的用户,运营商可能希望它有较高的抢占优先级,以优先获得其它LSP的资源。
5.网络治理-MPLSSNMP MIBs
IETF Network工作组制定了多个有关MPLSMIB的草案,对MPLS模型中的治理对象进行定义,目前这些草案都还没有成为标准。这些草案定义的MIB分为四个主要部分,分别是MPLS、CCAMP、PWE3和PPVPN,IETF相应的工作组在研究相关内容。
四、应用建议
运营商希望其大型骨干网的OAM解决方案可以覆盖3个主要方面:故障检测、网络可靠性测量和网络状态监控。目前,任何一种OAM机制都无法实现所有的OAM功能,大多数MPLS应用基于IP,如MPLSBGP VPN、RSVP TE等,上文介绍的OAM机制基本上可以满足运营商对这类应用的要求。在OAM机制的使用中必须结合其它网络维护治理工具,包括采用强大的网络治理工具,结合SLA,规范维护流程。为了满足复杂多变的MPLS网络运营的需要,必须灵活地组合使用各种现有的MPLSOAM技术