数据仓库实施的6种策略
在实施数据仓库时,需要理论策略指导,随着数据仓库技术的发展,数据仓库的实现策略已从原先的“自顶向下”一种模式发展到了六种模式。
1、“自顶向下”模式
在这种“自顶向下”模式中,数据集市和数据仓库的关系是单方向的,即数据从数据仓库流向数据集市。
2、“自底向上”模式
“自底向上”模式是从建立各个部门或特定的商业问题的数据集市开始,全局性数据仓库是建立在这些数据集市的基础上。
“自底向上”模式的特点是初期投资少,见效快。因为它在建立部门数据集市时只需要较少的人做出决策,解决的是较小的商业问题。“自底向上”的开发模式可以使一个单位在数据仓库发展初期尽可能少的花费资金,也可以在做出有效的投入之前评估技术的收益情况。
3、“平行开发”模式
“平行开发”模式是指在一个全局性数据仓库的数据模型的指导下数据集市的建立和全局性数据仓库的建立同时进行。“平行开发”模式可避免各部门在开发各自的数据集市时的盲目性,减少各数据集市之间的数据冗余和不一致。在“平行开发”模式中数据集市的这种相对独立性有利于全局性数据库的建设。
“平行开发”与“自顶向下”模式的区别在于它满足了企业中的各个部门希望在较短时间内建立本部门的决策支持系统的要求,使他们不用等待全局性数据仓库建立好之后才建立属于自己的数据集市。在建立数据集市过程中所获得的经验将有助于对全局性数据仓库的数据模型的优化和全局性数据仓库的建设。
“平行开发”与“自底向上”模式的区别在于,它用一个统一的全局性数据仓库的数据模型来指导各部门数据集市的建设,可以解决数据集市之间数据的不一致和减少数据集市之间的数据冗余问题。
但是用户的需求不是静止的而是随着新技术和新应用的出现而不断变化的。用户的需求变化不仅局限于要求更快速的硬件、更好的数据挖掘技术,性能更高的数据库软件,更友好的图形用户界面还包括所需信息内容的变化,以及所需数据的变化,这将导致在数据仓库或数据集市中必须加入某些新的属性、新的表或重组已存在的表、属性。新的需求将对数据仓库和数据集市的数据模型产生影响。
“自顶向下”、“自底向上”、“平行开发”这三种模式都没有考虑如何将用户的反馈信息不断地反应到数据集市和数据仓库的建设中。这三种模式都只在建设数据集市或数据仓库的过程中考虑用户的需求。
为了解决用户需求变化的问题,在业界引入了三种模式。
4、“有反馈的自顶向下”模式
在这个模式中用户的新需求的反馈分为两个阶段。第一阶段用户的新需求不断地被反馈给部门的数据集市,部门数据集市根据用户的新需求产生自身的需求变化。第二阶段部门数据集市把自身的需求变化反馈给全局性数据仓库,全局性数据仓库再做出相应的变化。
5、“有反馈的自底向上”模式
在“有反馈的自底向上”模式 ,在全局性数据库建立好之后需求的变化将主要体现在数据集市与数据仓库之间。可以在各个部门数据集市发展时保持相互之间的数据一致性并能根据用户的反馈信息不断调整自己,以这种模式建立的数据仓库在投入使用后能减少因用户需求变化所带来的不便。
6、“有反馈的平行开发”模式
在“有反馈的平行开发”模式中,在开发的初始阶段,开发人员主要是在全局性数据仓库数据模型的指导下建立部门数据集市,并把在建立过程中所遇到的问题及其解决方案以及用户的意见等信息,反馈给全局性数据仓库数据模型。全局性数据模型在指导部门数据集市建设的同时,也收集开发人员和部门用户的反馈信息并根据这些信息调整自己。经过调整,可以使下一阶段全局数据仓库的建设相对顺利地进行。
企业建设数据仓库的最终目的是让企业的经营管理者能够方便地使用数据仓库这一集成的决策支持环境以获取有价值的信息,帮助经营管理者对不断变化的环境做出迅捷、准确的判断和找出相应的对策。因此,界面友好,功能强大的为用户服务的前端工具应被有效地集成到这一新的数据分析环境中。数据仓库系统是以数据仓库为核心,通过数据提取工具、数据转换工具、查询工具、报表工具、分析工具、数据发掘工具等,满足用户对信息的各种需求。
典型的数据库系统结构图
在选择以上六类数据仓库实施策略,可参考具体实施情况,综合成本、效益、结果等因素,择优而实施,以实现数据仓库实施的成功。