语音识别进入IVR系统
杨阿昭 2000/12/07
最近,关于IVR系统最流行的话题无疑是语音识别软件的引进,它一方面提高了IVR系统的效率,另一方面又大大丰富了IVR系统的界面。
最初,IVR系统(自动语音应答系统)引起了呼叫中心的注意,是因为它使用户利用按键式电话的键盘对提示做出响应,就能够无需坐席代表的帮助而获取信息。在将呼叫发送到坐席之前,IVR系统也能帮助呼叫中心识别用户与其请求的性质。这样,通过使这些电话呼叫自动化,IVR系统为呼叫中心节约了不少资金。
按键式IVR受多方局限
在传统的IVR系统中,用户与系统交互的方式是通过电话的键盘。通常,用户在进入IVR系统后,会听到相关的语音提示选单,根据自己的需要可以按下键盘上相关的按键。系统通过DTMF信号传送用户按下的键,同时也将用户的请求传送给系统,从而触发相关的语音信息。这样,对于一些常见的用户请求,呼叫中心系统就可以通过IVR系统来处理,而不需要通过坐席代表的干预,极大地提高了呼叫中心的效率。
然而,按键式IVR系统的局限也是显而易见的。特别对于用户来说,在实际使用时更会感觉到诸多的不方便。首先,在听完了大段的语音提示选单后,用户需要特地停下来,按动电话上有限的数字按键,进行相应的选择,然后继续听下一段的语音提示。如果遇到简单的查询还可以忍受;如果是多层次的查询,用户则需要不停地听提示,再选择按键,再听提示,再选择……多次选择,才可以得到所需的信息。这对于以“客户服务”为核心的呼叫中心来说,显然是背道而驰的。
其次,我们都知道,传统的电话仅能通过DTMF信号,传送有限的几个数字及符号按键。这使得用户与系统的交互界面受到很大的限制,同时也就使得IVR系统的信息查询范围变得相当狭窄,只能是事先录好的各种提示音和信息。用户一旦有一些小的请求,但不是事先预录信息所涵盖的内容,就只好求助于坐席代表了。因此,传统的按键式IVR系统在减少呼叫中心系统的坐席代表的工作量、提高工作效率方面也很有限。
用语音给IVR发请求
正因为按键式IVR系统的多方局限,近几年来IVR系统的一个发展趋势就是:采用语音识别(ASR)技术,通过语音来输入用户请求,这也成为呼叫中心的一个富有吸引力的选择。
将语音识别技术引入到IVR系统的优势是显而易见的。一方面,用于IVR系统的语音识别能够加快事物处理的速度,而这些事物处理起来往往相对复杂,以致不能在传统的按键式IVR系统中实现自动化。例如,在预订飞机票时,在按键式IVR系统中,要求航空公司列出所有可能的出发和到达的城市是不现实的。但如果不列出所有航班的相关信息,用户却无法接受这种服务。当有了语音识别系统以后,用户只需说出他们的起点和终点的城市名字就可以了。
同时,语音识别技术的引进,也大大丰富了人机交互界面,使用户和IVR系统的交互方式变得灵活而方便,用户可以直接用语音进行有关的交互工作。由于使用语音和自然语言,用户在使用IVR系统时,就像与服务员一样进行直接交流一样,连续地说出自己的请求和选择,而避免了在按键式IVR系统中频繁按键的过程。
另外,引入语音识别技术也有利于呼叫中心的运营管理。通过语音识别技术,呼叫中心系统将大量的重复性问题分流到IVR系统中。一方面,充分发挥了IVR系统的潜力;另一方面,通过将呼叫中重复性的请求自动化,坐席代表可以处理更多特性化的请求,就不会感到枯燥无味,因为不需要再一遍一遍地重复处理相同的问题。
ASP涉足语音识别IVR
因为看到IVR系统引入语音识别技术后的巨大市场,ASP也开始提供这方面的解决方案。这对于没有技术和财力支持,或者不愿用这些资源来购买解决办法的公司来说,是非常有利的。但ASP面临的一项挑战就是,要尽力保证语音识别应用程序在任何时间都能够调整和升级。语音识别是一项复杂的技术,它需要投入大量的维护以确保其运行在最佳状态。
以Voci为代表,它的Sereno语音识别平台可使用Nuance的语音识别软件、Edify的IVR应用软件和 NMS的语音板。Voci提供了能被用于跨越许多垂直产业,如目录公司、旅游公司和公用事业的应用程序。一些应用程序还具有让用户下定单并检查定单处理情况的功能。Voci时常关注着语音识别应用程序应用得如何以及与用户的交互作用如何。Voci的语音识别应用程序按照呼叫的个数来计算成本,每个呼叫价格在0.5美元到1.25美元之间。
在必要时,ASP能够将呼叫传送回呼叫中心,这一点对ASP和呼叫中心来说,都是非常必要的。不论用户决定购买还是租用语音识别系统,应确保所选择的销售商具有人机接口方面和对话设计方面的专业技术,这一点和用户密切相关。不需要考虑隐藏在接口背后的技术,最关键的是要有一个清晰流畅的对话。
应用有待完善
经过多年技术的发展和完善,语音识别引入到IVR系统终于慢慢进入了商用。但不可否认,该系统还有待进一步完善。
笔者曾经有过亲身经历,在今年年初语音识别大举进入商用时,饶有兴趣地拨通了电话,在听完提示音后非常谨慎标准地说出了自己的请求,却不曾想系统没了反应,好歹就是不能识别笔者的发音。想到自己是南方人,可能发音不够标准,于是赶紧拽过了旁边的一位北京人,希望他能被语音识别系统接纳。很不幸,他的遭遇不比本人强。因此,要想真正地将语音识别IVR系统推广,语音识别还需要多方面的加强。
目前的语音识别技术,还存在许多的技术难点。英语方面研究较多,也比较成熟,有些方面已经可以进行商用。但在汉语方面,还有很多的工作要做,主要包括识别自然语句、适应各种不同的发音等。此外,由于语音识别技术还比较新,因此在CTI产业中还没有形成影响力,缺乏一支相应的产业化队伍进行推动。