【中国通信讯】11月27日,由中国通信学会主办的2009年IMS技术峰会在京召开,本次会议议题为“加速INS部署、惠及全业务运营商”。中国通信在线(www.ezcom.cn)作为官方网站将对本次会议进行全程直播。

思博伦通信亚太区Abacus产品经理 辛小秋
(本文为速记整理,不代表发言者准确观点,谨供参考)
辛小秋:
今天很高兴和大家聊一下关于IMS网络测试方面的问题。
今天主要是两方面,一是IMS网络的特点,尤其是测试方面的特点。第二,测试的重点和方法。
我们现在以交换为核心的移动网络,不管移动还是固定的移动网络,现在有一个融合的趋势,但是大家知道,它向什么方向融合的?固定网络还是IT网络还是接入网络,还是移动的网络,3G网络和IMS网络,大家都是向IP网络移动,在IP网络,不管是核心网还是支撑网,还是骨干网,大家全部叫IP,也是NGG网络IP的趋势。
在若干年前,ETSI也加入了IMS,目前我们定义的IMS网络有3GPP和ETSI共同提出的架构,中心是IMS的核心网,周边是传统的网络,接入的网络、宽带、固定的网络和移动接入的网络。IMS网络有这样几个特点,一是纯IP网络,二是多业务带来多种协议和多种媒体编解码方式并存,多业务就带来了多种协议,不管是IP协议还是接入网络承载的各种协议,多种编解码方式并存。多种接入方式,保留多种接入方式,不管是移动接入也好还是固定接入也好,还是传统PSTN网络接入也好,都在IMS作为接入网,IMS网络就是网络融合的共同趋势,由于这样一个趋势促使3GPP等共同推出全新的IMS构架。
我今天重点讲一下IMS网络中语音业务的特点,在IMS网络里,虽然给我们带来一些新的业务,白板业务和视频业务,传统业务上的语音业务仍然占到IMS网络里边重要的地位,占到50%以上。第二个特点,窄带语音向宽带语音进一步,窄带语音是指通话三百赫兹到三千四百赫兹,称之为窄带业务,3G网络定义宽带语音,从50到7000赫兹宽贷业务,目前IMS业务里边,窄带和宽带语音混合的特点,在IMS网络里边,尤其是承载网络里边,它存在多种编解码方式,而且是长期存在的。在VOIP里边有711、723,不同的带宽方式有64K,16K、8K、6.3K等不同带宽,我们也有新的宽带7.722等宽带方式,还有另外一个特点,语音的安全性越来越受到重视,不管怎么说,VOIP新的业务产生以后,最受到质疑的,一是在IP网络里边传送的话音如何保密,第二部分就是如何防止一些骚扰电话。第一在加密的部分,我们现在有了SRPP等加密的措施,在网络过滤方面,我们也取得很大的进展,SBC等大量地应用,像黑白名单等过滤的技术,在IP网络在IMS网络里边大量应用。网络安全性方面受到很大的重视。
另外一个特点,多种接入方式包括传统的接入方式和固定IP接入,移动接入、WIFI,可借鉴的未来,为什么PON网络能够大面积推广,IT发展起来以后,将来所有的固定电话可能被取消,逐渐演化成IP电话,全部光纤入户等,事实上我们发展了若干年,传统的电话依然受到广大老百姓的欢迎,而且在广大的运营商里面没有任何动力全部替换成IP电话,我们知道在日本和韩国有一多半换成IP电话,而不是传统电话。我们在中国PON网络大面积推广,可以光纤到小区,但是光纤到户还有困难,到了小区之后,我们装了一个ID,下面模拟线还是模拟的。
最后一个特点,用户的感受成为服务质量的核心。以前我们推广VOIP,推广NTN网络,可以说经济利益驱动,当然还有业务驱动,对于用户的感受并没有很特别的,以至于我们部署完了NGN网络以后存在大量用户投诉,存在用户投诉我们事前有准备,但是没有考虑到用户的感受逐步在提高。用户付给你钱,但是他要能得到他相应良好的服务,他心中有一个默认的对比,和以前网络和现在的IMS网络游一个对比,以前我这个电话听着非常清晰,现在我的电话受到干扰或者说时断时续,或者听到回声,如果有的话就要投诉。还有一点,运营商为了追求经济效益,默认或者听信网络提供商,设备十台就够了,经过检测十台就够了,根据新的测试理念是不够的。
我们要讲一下IMS网络语音测试的问题。我们测试的目的是什么呢?我们的测试目的有四个方面,首先要提高用户的满意度,降低部署网络的成本。如果我们能改善用户对语音业务感受,改善他们对语音质量满意度的话,实际上我们降低的不仅仅是经济上的还有社会成本,这对于广大运营商来说非常好。
第二,我们测试的目的,精准地评价网络。精准评价并不是网络提供商设备提供商所说的,这个设备能够达到多少,必须通过测试的方法,精准评价出这个设备从而在部署的时候,很精确地部署网络的各个节点,免得以后有问题要重新来做,这样经济成本就大打折扣了。第二个目的要提高网络的稳定性,提高稳定性有什么好处呢?第一对运营商来说,对网络设备提供商来说实际上是很好的广告,提高它的竞争力,部署的网络非常稳定,我的品牌效益就提升,第二对运营商来说大大降低维护成本,第三个测试目的,通过测试提高网络的安全性,我们现在应用心的加密技术,我们通过测试测出它的有效性,确认它确实是有效,而且是稳定的,还有一些过滤的EPI新的技术,我们需要通过测试加以认证。最后我们通过测试要验证各种各样新的功能的有效性,以及各种厂家设备兼容性。新的业务在IMS里边提出来,传统的业务有没有充分?这是一个很重要的课题。
网络语音测试的种类,实际上我们认为测试种类分两种,一种就是功能测试,一种叫性能测试,语音的功能测试业务的功能测试,变化的基本业务,电话的补充业务,传真的业务,或者安全性的功能等,第二部分是性能测试,性能测试里边分为两个方面,一方面是压力测试,检验我们这个网络或者网络设备最大承载呼叫能力。
第二方面是稳定性测试,测试这个系统或者这个网络在长时间工作情况下能不能稳定的工作,能不能提供稳定的服务,功能测试和性能测试之间是有内在联系的,并不是像以前所说的割裂开来,做功能测试拿一个电话机或者网络管理出来一系列的功能,能够实现就一下子打死了,实际上不是这样子的,我们想一想,我们的新的功能将来要放在网络上应用,将来的网络有一定话务量的基础,有一定的背景流量,我们在实验室里做试验和测试的时候,如果没有背景流量出来,我们所测试的功能将来会不会出问题,这种真实性会受到质疑,我们在一定背景流量下测出来的结果和没有背景流量空的网络流量测的结果是不一样的。以前做测试都是大量反复呼叫测试,在现实网络里边,各种各样的功能,各种各样的呼叫各种呼叫模型是可变的,在一定比例下所在的,在各个时间段比例也是不一样的,我们的呼叫时长变,我们做测试呼叫时长是固定的,做性能测试简单的呼叫,任何一种功能测试,传真占多少比例,待加密或者待过滤的呼叫占多少比例我们都不知道,我们在建设网络里边,这些和实验室的测试环境差距相当大,我们怎么样把这个差距缩小,是我们考虑的问题。
网络语音测试真实性的问题。我们在测试当中考虑用仿真的设备代替真实用户呼叫测试,仿真设备和真实设备能够在多大程度上接近,这是我们搞测试要研究的问题。比如物理特性,仿真的疫苗能不能仿真出真实设备的特性,一个电话机,仪表能仿真出吗?软件的功能,电话机上所有的按键出来的功能做呼叫转移,在仪表上能做得出来?这是最基本的问题。我们仿真的环境,在实验室里边和我们真实环境到底差在哪儿?主要是两个方面,一是真实环境是有损伤的,比如IP网络,在实验室里边是非常干净的网络,非常干净的网络做出来的测试结果,拿到真实网络里边可能会发生变化。
第二,呼叫模型的问题,刚才我也讲过了,真实网络呼叫模型是千变万化的,非常复杂,这是不合逻辑也是不合理的。
第三,我们在进行性能测试时,一定要考虑用户真实的一种感受,这个设备一小时出来一百万,我们给了一百万呼叫量,没有错误,这个结果出来了,实际不是这样子。这个时候要看看用户的话音质量怎么样,加了极限话音量,用户拨完号能不能听到回铃音,这些问题引发大量的投诉重要的原因。
IMS分为两个层面,一是控制层面和数据层面,控制层面就是融合网络存在大量的信令协议来控制各种业务呼叫。数据层面:融合网络中的媒体流以RTP和传统TDM两种形式存在。既然IMS网络存在两个层面,网络测试也存在两个层面测试,对于控制侧面,呼叫处理能力,测试软交换和CPS交换能力,一小时处理多少次呼叫,另外我们也要考虑,在加上这种压力的情况下,我们信令到一定的阶段,信令时延超过我们的范围,导致用户将来摘机械没有拨号,拨完号很长听不到回铃音,时延超过了用户可以忍受的范围。数据层面着重测试质量,比如语音实验等参数。我们看一下语音业务可能在IMS网络存在的问题。控制层面由于VOIP协议是开放的协议,可能导致不同的问题,各个厂家,华维这样设的,我这样理解这个参数,中兴公司看到这个协议可能那样理解,加了另外一个参数,在协议里边并没有定义对与错,都是可以这样做的,在实际当中两种设备放在一起,可能会产生一些冲突。造成了互通的问题。第二种问题由于协议性能瓶颈导致的,大部分OEM来的或者买别人,自己开发的比较少,协议并不是很好,话务量高的时候,就出现问题。这个时候用户会听到拨号音延时,回铃音等待,甚至会出现掉话的问题。
第二数据层面的问题,数据层面的问题,语音质量的问题,其实是有两方面造成的,一方面是网络传输造成的,网络不好,时延太大,更重要的是编解码器造成。一种是追求算法性,算法快,高频和低频一部分频率卡掉,只要中频,这样会特别快,处理能力非常高,女声高频的部分听不清楚,声调的变化男生低频的部分也被改变了。还有一部分追求完美型,语音质量非常好,但是算法相对慢。产生给用户效果是什么样子,语音有可能时断时续,还有变调,实际上由于一部分频率给砍断不要造成的,还有一部分由于语音压缩,任何语音压缩都是有损的。还有回声、音量变低或者背景噪声等。
这是IMS网络的构架,移动接入,固定IP接入,都作为IMS核心网的接入网,媒体流通过IMS承载网走的。语音测试无外乎仿真用户终端这一部分,仿真移动接入互定接入,测试IMS核心网络和IMS承载网络对各种各样的协议,不同接口之间,流畅地处理了,能不能达到设计的目的。但是性能测试我们要把握一个平衡点的问题,所谓平衡点就是和以前测试查找无差错有一个很大的不同,以前性能测试只是查找无差错点,加上大话务量呼叫,24小时没有呼损或者呼损很低,这样的话找到性能测试的答案,OK能达到五十万或者一百万,测试通过。根据这种结果部署我们的网络,往往是失败的,往往带来大量的客户投诉,我们忽视了用户的感受。我们的平衡点无差错是我们的条件之一,我们还要符合其他的条件。当我们的话务量达到无差错点这个级别的时候,我们看一看是不是语音质量已经恶化了,因为99%的网络设备在呼叫量达到自己处理能力极限的时候,语音质量方面的能力就变弱了,大量的呼叫得排队,我会变得非常繁忙,难免会出现问题,语音质量会下降,根据我们的经验值,当呼叫量超过最大容量50%的时候,语音质量就已经开始下降了,下降到什么样的程度可以忍受?单向时续不能超过150毫秒,超过150毫秒会影响。呼叫拨叫时间,拨完号之后我们多长时间听到,这个规定我们在10%话务量以下的时候不能超过1秒钟,超过90%重载的情况下不能超过2秒钟。有的存在10秒以上,达到宣称话务量的情况下,呼叫建立时间已经超过了十秒钟,用户拨完号等十秒钟才能听到回铃音,时间台长了。用户摘机半秒钟之内必须听到拨号音,大话务量情况下,话务量已经达到了承受极限的时候,我估计至少在5秒钟以后,这时候一摘机等好几秒钟,有的甚至听不到。像这种情况如果出现的话,及时我没有任何错误,没有呼,实际上这种网络测试结果也没有任何意义。正确的测试方法,我们找到无差错点,其他的条件是否符合平衡点定义的条件,如果不符合的话,把话务量降下来,直到其他条件都满足的情况下,我们才认为我们找到了平衡点,根据这个平衡点再部署我们的网络,那个时候我们的差错率会很低,用户投诉量也会少。
第一个例子就是我们测试接入网关能力,测试了24小时,也加了15000次BHCA呼叫流量,24没有任何错误,呼损是0,按照以前的标准测试结束了,BHCA达到一万五千次呼叫量的时候,用户摘机1.5秒之后听到拨号,大大超过500毫秒的标准,PESQ低于3.0,低于4.0入网标准,话务量降到一万的时候,BHCA降到450毫秒,语音值增加到4.0以上,这个时候真实处理能力是一万,而不是15000,假设我们的一个小区里边,需要15万BHCA情况下,原来需要部署十台就够了,实际根据我们平衡点的理论,我们需要部署15台才够,如果部署十台的话就可能会出现问题。
在一个试商用网络里边,用户投诉,我们在两点之间仿真一对,让用户做端到端的质量测试,保持八个小时呼叫,平均PESQ是4.2分,按照以前的评价标准,4.2分就非常好了得到最大值是4.5小,最小是1.4,我们管它叫漏斗,漏斗越多,实际上效果越差,一会儿非常好,一会儿听不见了,观察随时间变化的曲线。
今天不能讲很多测试理论的问题,只是告诉大家测试基本的原则,我们要以用户的感受为我们自己的感受,提供给大家最真实的测试,而不是报表好看的数字。谢谢大家!