来自:中青旅尚洋电子技术有限公司BI产品部 作者:贾晓谦 日期:2003年08月26日 浏览次数:986
目前国内各大保险公司都已着手数据仓库系统的建设工作,从数据的规模、IT人员技术的积累、市场竞争的加剧等客观情况看,构建分析型应用的时机和条件确实已经具备。然而,在目前的条件下,保险企业数据仓库应用的成功之路并非一蹴而就;成功实施数据仓库应用的重点还应从应用层和技术层两方面提升。
数据仓库面临四难
系统可用性不高目前数据仓库面临的尴尬首先是,企业花了很大精力上数据仓库系统,结果运转起来却发现没有用户,或者很少有人使用。分析其中原因,一方面是需求不到位,另一方面,缺少标准化的过程,由于系统的定位是构建在广泛的系统之上,为广泛的用户提供服务,所以不可避免要面对概念上的统一。信息呈现方式单调目前阶段,应用主要以固定报表、OLAP分析为主。固定报表一般是将原来手工的或者半自动的管理报表在数据仓库的基础上再重复一次。OLAP分析就是从不同的角度观察指标,并不是尽善尽美的信息表现手段。
系统灵活性不够 灵活性体现在系统对新需求的适应上,不变是相对的,变化才是绝对的。但是增加新的需求要涉及数据模型、ETL(Extract, Transform, Load)、前端应用的一系列调整,这样就使系统陷入疲于应付的状态。
系统不稳定所谓的不稳定,并不是纯粹的技术问题,而更多的是数据源问题。一方面中国保险企业的业务发展日新月异,作为主要数据源的核心业务处理系统始终处于不停的升级、更新换代中。其次,大的保险公司基本采用分布式处理模式,即数据分布在地市分支机构,数据向总公司集中过程中,保证这个数据流转通道的稳定本身也是个庞大的系统工程。再次,从管理体制上看,对事后数据流转体系的管理、监控远没有对时实交易数据那样重视,投入的管理力度不足。
这些情况综合的结果就是在数据仓库的构造上花费了很大的精力来应付数据源的各种变化,这样给最终用户的感觉却只有一个:系统不太稳定,还不成熟。
为实现数据仓库在保险行业的成功应用,应从两个方面入手,一个是应用层问题,一个是技术层问题。
应用层 :需求推动
应用层问题其实是需求问题,就是要回答希望以怎样的形式从数据仓库中获得怎样的信息。数据仓库应用上的需求与传统OLTP系统的需求相比有显著的不同,OLTP系统的需求收集、整理、分析上是按照事务处理的逻辑进行的,与现实中有对照关系,给人“照章办事”的感觉。而数据仓库应用是为了提供企业级的管理和决策信息,它的需求分析本身是一个探索的过程,最终用户在事前并没有多少先见之明可供参考。这并不能说数据仓库系统的应用可以没有需求,相反要建造一个成功的数据仓库系统,必须要整理出完善的需求。数据仓库应用系统是一个周而复始、生生不息的循环过程,系统要想螺旋式上升并逐渐成熟,原动力只有一个:需求推动。
那么如何确定这个起点呢?这里有一些经验可以借鉴,实践证明从构造一棵大树开始是比较好的选择,具体来说是以承保、核保、报案、理赔等业务环节为树干,以管理人员、统计人员、财务人员等角色为树支,以签单数量、承保数量、脱保数量、有效保单数量等系列指标为树叶,归纳、总结出来保险企业的管理指标体系。这样后续的固定报表、OLAP分析、EIS查询、数据挖掘等都可以看做是构架在这个指标体系之上的应用系统。
在评价数据仓库项目是否会取得成功的问题上,首要因素就是看实施团队是否能够拿出一个经得起推敲的、经过千锤百炼的保险企业的管理指标体系来。
技术层 :打造成功模型
技术层问题分为几个方面,数据模型、ETL、前端应用和系统管理。
数据模型是个大问题,数据仓库模型应该怎样构造?尽管国外的厂商几乎都提供了自己的模型,但具体到中国的保险企业,要想真正走向数据仓库应用成功之路,必须从国外的模型框框中跳出来,打造出符合中国保险企业特点的数据仓库模型,国外成功的经验可以借鉴,但不能照搬。成功的数据仓库模型能够应付数据源以及业务逻辑的变化,能够弥补上面提到的系统的灵活性和稳定性的问题。
ETL也涉及到一定的业务逻辑,但主要还是技术,要重点考虑ETL的性能、时机、频率等。来自前端的挑战主要是应用形式,目前常用的前端展现工具或多或少都有不尽人意之处,如果只是停留在直接使用某一工具的层次上,很难做出一个另人满意的系统,一定要根据实际需要来定制。具体说,在保留固定报表、 OLAP分析、EIS查询的基础上,增加信息主动推送的应用,以往系统之所以可用性不高与应用形式有很大关系,当信息量很大的情况下查找的方式的确非常枯燥,而将满足一定条件的信息主动推送到管理者面前确是非常好的主意。
数据仓库系统的管理目前是限制应用走向成熟的瓶颈,数据仓库应用一定要有管理系统。这个系统一般要具备下列功能:系统参数管理、ETL过程监控、 ETL日志管理、前端应用监控、系统元数据管理等等。有个问题一直没有得到很好的解释,就是数据仓库的系统管理员应该具备怎样的能力?从以往的实践来看就是数据仓库项目结束后由开发团队中的一些人留下来做维护,因为除了开发团队的人以外,一般的工程技术人员没法经过简单的指导就能维护这个庞大、复杂的系统,尤其是出现突发事件的情况下根本就是束手无策。从另一个角度看这也说明了开发一个能够控制复杂系统的管理系统是何等困难。
管理系统的目标是使数据循环体的各个环节都能达到可配置的状态,可以最大限度的提高系统的灵活性和稳定性。也可以将管理系统作为评价数据仓库应用是否成熟的重要标志。
结束语
要成功构建保险企业数据仓库应用系统必须关注以下几个方面:能够提出符合中国保险企业管理需要的指标体系;能够构造符合国内保险业务特点的数据仓库模型;在前端应用上要下大功夫,建立信息主动推送及流转机制;管理系统则是数据仓库应用能否支撑下去的重要标志。