作者:卢艳军
首先阐述了基于端到端的承载网络性能测评的重要性和紧迫性,接着介绍了端到QoS测评的新方法,然后着重说明了端到端QoS测评新方法可解决运营质量治理中存在的诸方面问题,最后展望了网络质量治理的未来。
1、网络承载性能亟待测评
随着ip网络的发展,最初以承载为主要功能的IP网络正渐渐地转变为以增值业务运营为主要功能的网络。业务的发展不断给网络提出更多的挑战,业务流量的增加导致网络负荷加重,网络反应慢、链路带宽不足、扩容投资不断增长,网络规划和网络质量治理缺乏可靠的依据和手段,测评现有网络性能对新业务的支撑情况也属空白。总而言之,基于服务质量(QoS)的增值业务的运营难于开展,IP网络承载性能状况和对实时业务的支撑情况迫切需要在不影响业务运营的情况下进行测评、分析和治理。
业务对网络性能的要求直接来源于业务对端到端客户感知(主观质量)的满足程度的需求。尤其对于目前在网络中涌现出的越来越多的实时业务,如VoIP、IPTV、VOD等业务对端到端的可用带宽、时延、抖动和丢包十分敏感,这些性能参数严重影响着此类业务的开展和运营维护。这些指标的组合整体反映了承载网络所能提供的QoS,因此准确把握这些网络QoS指标是对网络承载性能进行测评的基础。
QoS是指网络中多个环节共同提供的性能,包括路由队列治理、应用层QoS保障、IP层QoS措施和链路层QoS保障。每一个环节的QoS所起的作用不同,对网络QoS的影响也不同。
●路由队列治理包括RED(RandomEarlyDetection)、ECN(EXPlicitCongestion Notificaiton)、FIFO(First-In First-Out)、Drop tail等队列治理方法。这些方法直接作用在路由器上,对路由器的队列缓冲区进行排队治理。这些方法通过对数据的转发优先级、丢弃优先级、丢弃概率和丢弃门限进行限定,对数据包的到达、排队等待、转发行为进行限制和处理,为数据包不同优先级、不同服务等级提供不同的行为规则。
●应用层QoS保障的实施依靠于应用本身的控制策略和措施。例如语音播放软件的缓存机制、视频误码掩饰机制都是基于应用层的QoS保障。
●IP层QoS机制是利用IP数据包头信息进行包的路由选择和转发,包括利用ToS(TypeofService)字段信息确定服务类型和优先级,以及利用综合服务、区分服务建立流转发行为规则保证QoS。
●链路层QoS的保障是通过在链路层建立虚链路(如ATM中的虚通道)或定制链路层数据的转发行为(如MPLS的包转发控制)来实现质量分级。
但是,目前QoS治理无法在现有的IP网络中保障业务的质量。这是因为目前网络的QoS保障措施绝大多数是尽力型的而不是保证型的,而且几乎所有QoS保障机制都是基于逐跳的行为控制的,而不是面向端到端的保障;另外,不同业务有不同的QoS要求,网络提供服务质量的等级和业务的要求不是一一映射的关系,甚至是无法映射的。所以,业务的QoS保障成了目前服务提供商要解决的重要问题。然而,解决这一问题却是一个工程技术界的难题,这将是一个漫长的过程。不过,对现有网络的性能进行评估和质量分级治理是网络运营迫在眉睫的事情。
2、端到端QoS测评的新方法
网络QoS的评价指标主要包括可用带宽、单双向时延、单双向时延抖动和单双向丢包。可用带宽直接影响网络业务的质量、网络对即将开展业务的支撑能力以及网络的扩容规划和设计。单向时延、单向时延抖动和单向丢包之所以不可缺少是由于业务服务器和客户终端内容交互的非对称造成的。IPTV、VOD等业务的质量好坏直接受媒体服务器到用户终端之间单向链路性能质量的影响,而与另外一个方向的链路性能关系不大。所以单向端到端链路的性能质量指标要比双向性能指标更能准确地反映网络对业务的支撑能力和业务的真实服务质量。目前测评网络性能质量的方法有很多种,不同方法存在不同的准确性和可靠性。传统的网络性能测试方法包括网管测量方法、仪表测试方法以及手工简单测评。这几类方法都存在一定的局限性,主要表现在一些性能指标无法获取以及获得这些指标需要依靠于路由器的配合,甚至影响正常业务的运营。下面将对传统的方法和基于端到端网络服务质量测试的方法进行分析和对比。
网管测量方法是通过对网元设备统计信息的采集获得相应的QoS指标,如流量统计和丢包率。这两个指标是网元设备的统计信息而不是端到端的性能信息,所以网管测量所得到的信息是单点设备的信息而不是业务所经链路整体的性能信息。单向时延、时延抖动以及单向丢包是网管系统无法得到的,因此网管系统基本上是无法进行网络端到端质量测评的。
仪表测试方法虽然可以测量网络的最大可用带宽、时延和丢包,但是最大可用带宽的测量采用传统的“调波法”,这种方法利用仪表发生模拟数据包的方式,持续向链路中发送数据,直至链路完全被模拟数据占满,从而得到链路的最大可用带宽。显然,它是不能在正常运营的业务网络中进行测量的。单向时延和丢包的测量需要多台仪表配合测量,而且不能得到真正准确的时延,这是因为多台仪表之间时间同步和时钟频偏的问题无法真正得到解决。
其他手工方法,如用ping命令或tracert命令会受到防火墙和路由设置的限制而无法解决指标测量问题。即使没有这些限制,这些命令结果反映的双向时延也不能说明问题的本质,因为只有上下行两个方向分别单独测量的结果才能表明问题的真实情况。
要不影响正常业务运营的情况,测评网络的性能质量状态必须有更先进的技术和新的测量方法以达到对网络状态的真实反映。目前,在众多企业和高校的技术人员的不断努力下,终于找到一种有效解决这一问题的方法——基于端到端的网络性能质量测试方法,它利用新奇的技术和高效的算法达到快速、准确地测试和测量的目的。
这种基于端到端测试的指标是端到端之间的指标而不是单个设备、某一段甚至某一跳之间链路的指标。端到端的含义包括业务的起始点和业务的终止点整条路径,是业务传输的全部环节。
端到端的单向时延是从一个测量点(一个具体的IP地址)到另外一个测量点的数据报文传递所用的时间,这个时间是转发时延、排队时延和传输时延的总和。要实现对其准确测量必须要解决几个问题,其中时钟同步是一个基本问题,另外一个重要的问题就是时钟频偏和时钟跳变的问题。也就是说,不仅需要解决时钟基准问题,还要解决时钟漂移问题。目前,此领域最新的单向时延测量的算法利用智能判定和模糊逻辑分析的方法可以较好地解决这一问题,使单向时延的测量成为可能。
端到端的可用带宽也是分两个方向分别来看的,目前大部分骨干以下的链路上下行两个方向可用带宽明显不对称,一般是下行大于上行,而在骨干以上及出口链路上两个方向数据链路的可用带宽比较接近。因此,区别不同方向的链路带宽是必要的。如何得到不同方向的链路在不同的时段还有多少剩余的带宽可供使用、是否拥塞、链路带宽是否可以满足当前业务和将来新业务的开展?要解决这些问题,就必须提供在不影响现有网络业务正常运行的前提下可以测量可用带宽的技术。传统的“调波法”和网管的流量统计法存在影响业务、单点统计、统计粒度不够精细等缺点使它们无法满足现有网络性能测试的要求。目前基于端到端的剩余带宽测量方法采用了一种“微流量”测试的新方法,它通过向网络中发送的数据流量(数据流量=链路带宽×0.3%)即可完成对链路可用带宽的测量。
基于以上两种新技术就可以很轻易得到诸多新指标,如拥塞概率、网络健康度等性能的评价指标,结合其他丢包率和时延抖动的分析即可构成相对完备的网络QoS评价体系。
3、利用新方法解决运营质量治理中存在的问题
当前运营商在网络运营中存在的诸多运维问题需要运用准确、高效的分析手段和解决方案来提高运营质量、客户满足度和ARPU值。从网络功能的分类角度来看,这些问题主要集中在以下几个方面:
●核心链路的性能监测和维护;
●接入链路用户投诉;
●大客户链路的服务等级保障和维护;
●业务专网的运营维护;
●支撑系统的维护治理。
不同的网络面临着不同的问题,从另外一个角度来看,这些问题又分为一些基本网络维护、客户QoS、新业务开展以及网络健康度和规划等问题。
3.1基本网络维护问题
网络的基本维护问题包括长期监视网络可用带宽、及时发现链路带宽变化、定期监控不同方向链路时延和丢包情况以及拥塞情况。
这一问题可以通过端到端性能的测评定时提供测量结果和性能报告以及网络现状的监测和状态的预警,发现网络的瓶颈点和拥塞点。
3.2客户QoS问题
客户QoS是目前分级服务的主要内容,对于不同等级的客户提供不同的链路带宽、服务等级和QoS。那么,如何保证服务质量的承诺和迅速提供QoS的监控手段呢?
端到端性能测试可以测量客户链路的可用带宽,确保链路的可用性;测试链路的单向丢包和单向时延,确定链路对业务的支持情况;测量应用业务节点的响应时延,界定链路性能和服务器性能的故障和问题;通过拥塞定位和拥塞分析确定链路的薄弱环节,提供客户链路质量的保障手段。
3.3新业务开展问题
对于新业务的开通,端到端网络性能测试系统可以很轻松地对现有网络的状态进行测试和评估。首先,可以测试新业务部署点到不同访问点单向链路的带宽,确定现有网络可用带宽是否可以满足新业务的需求;其次,测量单向时延、单向时延抖动和单向丢包,确定链路的性能是否满足实时业务在时延方面的需求;最后,通过链路拥塞分析猜测链路的瓶颈环节,全面确保新业务的运营开通。
3.4网络健康度和规划问题
健康度是根据网络多维性能的测评结果对网络性能质量的整体评价,包括时延、丢包以及带宽占有率多个性能指标纬度,如图1所示,不同的指标纬度构成不同的质量区域,不同的区域反映了不同的健康状态。
图1 多纬度网络健康度评价坐标系
3.5性能测试系统部署问题
为了实现对网络性能质量的评估,基于端到端的网络性能测试系统至少要具备两种不同的形态以满足不同需求。首先,针对需要解决业务开通测试和暂时性链路故障定位分析的情况,在骨干或核心网中部署单台测试设备作为测量的一端,另一端用普通的PC远程下载Agent即可实现端到端的测试;其次,对于需要长期监测的大客户链路或业务专网,需要具备分布式测试和集中治理的能力,定时提供网络健康状况的报告。图2描述了分布式监测集中治理的QoS监测系统,这个系统中包括前端设备(IPQoS-Agent)和中心控制治理单元(IPQoS-CCMU)。前端设备负责在多个对等体之间对链路性能进行测量以及对业务平台服务响应进行测量,并将测试后的性能数据传送给中心控制治理单元。而CCMU在存储治理测试结果的同时,还负责对前端设备的控制和策略的调度。
图2 QoS测试系统部署方案
4、网络质量治理的未来
网络的运营模式由粗放式带宽租赁经营到精细化分级质量运营过程的转变以及增值业务对网络质量的不断挑战,使网络质量的可度量化、可治理性、可运营性成为将来网络运营维护治理的重中之重。因此,网络性能质量测评手段是这一切的基础,在这一基础之上建立网络质量测评体系是网络高效运营的要害。