1、错误的项目发起:
在数据仓库实施项目经理之上,还有两个关键的人物对整个项目的实施产生重要影响。一是为更有效的利用企业数据和信息技术投钱的人,可以是公司总裁、市场副总裁、研发副总裁等。在项目经理和项目发起人之间还应该有一个被称为驾驭者(driver)的人,来控制项目的进度,保证项目沿着正确的方向前进,此人应具备如下3条特点:1)在其他项目的执行中已经得到人们的尊重。2)对技术抱怀疑态度。3)办事果断,而不是老好人。
表1:当数据挖掘项目缺少一些关键因素时可能付出的代价
2、制订了不可能完成的目标:
实施数据仓库可以分成两各阶段:一是向公司高层游说,说服他们实施你的数据仓库计划。二是在得到了预算后努力实现自己当初许诺的目标。很有可能你当初夸的海口太大,比如“给我一百万,就能让公司里的每个人非常容易的得到他所想要的任何数据”。实际上很多情况下,数据仓库不可能提供人们所要求的所有数据,比如古老的历史细节数据可能根本就没有放到数据仓库中。
3、犯政治幼稚病(Engaging in Politically Naive Behavior):
很多数据仓库项目经理都会犯的典型的错误是在宣传数据仓库时把他说成“他能帮助管理人员更好的制订决策”,当一个自尊的管理人员听到这样的话时典型的反映就是“这个家伙认为我们的决策做的不好,要用他的系统来给我们打补丁”,然后在后面的实施过程中就很难取得这些管理人员的支持。
4、把所有能找到的数据全都放到数据仓库中:
把许多无关紧要的数据都放到数据仓库中,很快就会导致巨大的数据库,响应缓慢,难于管理和维护,使数据仓库最终成为一个华而不实的东西,只在理论上有用,而实际上很难使用。
5、认为设计数据仓库就是设计事务数据库:
由于两者的目的根本不同,应此在设计数据仓库时也不能应为采用的相同的数据库管理软件,就不按照数据仓库的特殊需求来设计他。
6、选择一个面向技术的而不是面向用户的人做数据仓库项目经理:
数据仓库实施过程中要与企业中各个部门的人打交道,数据仓库建立好之后也是为用户提供服务,如果只是专注于技术而不理用户的态度,很容易导致项目被中途终止。
7、只专注传统的内部关系型数据,而忽略外部数据、文本、图像、甚至声音、视频数据:
白宫80年代在50家大公司中进行的一项调查表明高层管理人员使用的95%的信息是来自于公司外部(新闻,朋友,同盟者),并且越到高层对公司内部的数据越不重视。因此好的数据仓库应避免让高层人员直接看一条条的细节数据,而是经过统计分析后的汇总数据或漂亮的报表,并与外部数据结合。
8、用交叠的或冲突的数据定义交付数据:
数据仓库的唯一致命弱点就是必须取得数据定义的一致,反之很容易导致用户迷茫和厌烦。
9、相信软硬件供应商对性能、能力和可扩展性的承诺:
各个厂家对产品承诺的性能通常都是在最好的条件下获得,或被完全夸大,而在实际应用中很难打倒,因此实施过程中为自己留下余地。
10、相信一旦数据仓库建立起来并开始运行,你的任务就完成了:
每个在通过使用数据仓库给自己带来好处的用户都会不断的要求你更新数据仓库中的数据,对更快的响应速度的要求需要你不断的采用新的技术和更新设备。一个典型的错误就是把数据仓库交给一个项目组,认为一旦仓库建立起来,组就可以解散。数据仓库建立完成后需要继续被精心维护至少一年。应把数据仓库看成是一个过程而不是一个目标。
11、专注于动态生成查询、数据挖掘和定期生成报表:
利用数据仓库的典型过程是1)把数据从各个地方拿来放到数据仓库中,2)进行动态的数据查询,3)将常用的查询结果生成报表。但这些报表只有被真正利用起来,投资才会真正产生效益,而高层管理人员一般很忙,他们很快就会对定期发到他们手里的这些报表厌烦,而永远不会去看。更好的办法是建立危险信号警报系统,在数据仓库中定义各种警报条件,只有当这些警报条件满足时才会发送信息给特定的人。