主题:怎样去宣传数据仓库?
作者:hem
所属论坛:数据仓库
问题点数:300
回复次数:1
人气指数:6
发表时间:2001-9-13 16:38:32
数据仓库是 面向主题的、集成的、随时间变化的非易失的数据集合,用于支持管理层的决
策分析。
数据仓库对历史的数据做分析,以得出所分析主题的发展趋势,来支持决策层的决策分析。用于联机分析处理。
数据库 普通关系型数据库 大多用于联机事务处理,处理当前的事务、交易。
集成的例子:
就拿一家百货公司来说, 公司有好多的分公司,每个分公司有自己的日常交易纪录数据。
有真实的详细的交易历史纪录、也有月度、年度归总数据。总公司需要了解公司的运营状
况,以决定以后如何拓展业务,了解客户购物趋势,推广新产品等系列决策。试想想,如果
每个子公司将所有的历史数据都送到总公司,请问,总公司需要多少磁盘、多少资源来存储
这些数据? 总公司要这些数据干什么?总公司不需要这些详细的数据,如果子公司根据一
定的周期归总之后在送到总公司,这样一来,数据量小了,有利于分析了。但是,这么多子
公司里面,每个公司的数据结构定义可能不相同。需要统一数据定义。
送到总公司来的数据是比较全面的。这样一来,公司可以对用户购物趋势、购物能力等主题
做一个比较全面的分析,以发掘客户、扩大公司规模。
面向主题:
通讯公司可能只是纪录用户的应收款、预付款、通话纪录、费率。如果建立一个客户主题区
域,用来纪录用户所购买的服务、用户所在地域。这个主题区域可以帮助通讯公司预测客户
增长率、客户的地域分布、客户购买服务的倾向以增加新的服务,在那些区域出售什么通讯
产品等等的决策。
随时间变化:
上面两个例子都提到这个。百货公司的记账系统、通讯公司的记账系统都是随时间变化的最
好的例子,记账系统定期归总数据,然后将归总数据不断加到数据仓库里面来,这样数据仓
库也就是随时间变化的。
非易失性的:
一般的,追加到数据仓库里面的数据是不允许更改的,它不同于联机事务处理系统,允许修改数据库纪录。这样数据仓库的数据一般不会丢失。
数据仓库有几个要点:
集成 (抽取、转换、装载) ETL
元数据 (描述数据的数据) MetaData
主题 星型结构
数据仓库中 数据的查询是最重要的。 视图、索引是提高查询的选择。
代码库是统一、集成的前提。