最近的调查显示超过90%的大中型公司今年将建立仓库。根据IDC的报告,大约80%已投资于数据仓库的公司都认为获得巨大成功。
为什么?数据仓库提供了与OLTP系统截然不同的集中式存储系统,前者包含了从公司拥有的许多数据库中提取出来的商业数据。这些数据生动地反应了企业的现实,被予以分析,以及作为战略性的竞争武器。快速、准确地分析商业问题,将会影响公司的长期生存。例如,在区域需求模式中分析趋势,能够帮助一个公司对供货进行治理,并且增加2百万美元的销售额。
与其它操作性系统不同,数据仓库中的数据结构是为快速检索和分析而进行优化的。数据是历史性的,并且以固定间隔进行更新。
在定义、建立和使用数据仓库的过程中存在以下过程:
对最终用户的商业需求建立模型。数据仓库的设计者必须从各种最终用户中了解信息需求,然后将这些信息需求转变为数据模型。设计得必须以严密、精确的方法确保模型的完整性。
为元数据建立模型。在为最终用户需求建立模型的同时,数据仓库设计者还必须为元数据(关于数据的数据)建立模型。该信息确定了进入数据仓库的数据范围,以及与数据有关的规定。由于数据仓库是面向主题的,元数据的建模可能跨越数个功能性商业区域。
元数据分为两类:加载和用户
加载视图:描述了所有数据源,以及与提取、刷新和向数据仓库传送数据有关的所有规定。
最终用户视图:在这里,模型与数据的商业用途相匹配。最终用户将其作为布局图,依此访问和搜寻信息,评估,决定,实施抽象,转换和访问工具。一旦设计者为最终用户的需求和系统中的相关元数据建立了模型,接下来需要为实现数据仓库选择实施工具。最后应该选择满足用户需要的工具,用户将使用这些工具访问数据仓库中存储信息。
Oracl eWarehouse包含了一整套产品和服务,覆盖了数据仓库定义、设计和实施的整个过程。
任何数据源(Any Source)
搜集在Oracle Warehouse中的数据来源众多,包括内部存储的业务数据和外部的。在传统上,数据仓库中的大多数数据来自内部业务系统,如定单输入、存货或者人力资源等方面的数据。然而,外部来源(人口统计、经济和Internet)正琥来越普遍,并且将会提供比内部来源更多的数据。上述两种来源应该融合在一个单一的存储系统中,并加以治理,从而为最终用户提供对这两种数据源的无缝访问。Oracle提供各种Oracle Gateway(网关)及SQL*Load实现不同数据源数据的装载。
任何数据(Any Data)
考虑到现在需要访问数据仓库的用户范围,系统设计者面临着纷繁各异的需求。对数据的访问必须快捷、直接和直观。大多数用户需要直接查询和深入能力,而另外一些需要更复杂的分析能力。同时数据仓库必须能够处理新型格式的数据,如声音、视像、文字和空间数据。而且,日益增加的用户提出的大量历史性需求,往往会导致超大型数据库(VLDB)的出现。为了满足这些需求,Oracle同时提供包含OLAP选件(EXPress Server)的Oracle Universal Server解决方案。
任何访问需求(Any Access)
Oracle提供了范围广泛的工具集,能够帮助各种类型的用户访问数据仓库中存储的数据,其中包括:随意查询和报告、深入和旋转,以及完全分析(建模、猜测和假如-怎样分析等)。大多数用户需要一种直接和直观的工具,帮助他们轻松地访问数据,从而作出明智的商业决策。也有一些用户需要进行更复杂、冗长的分析,以支持制定商业策略。上述两种不同情况体现了整个企业对于信息访问的需求。今天的数据仓库已经突破了治理人员和分析人员的范围,现在各种专业的知识型员工都在使用数据仓库。这种进步是权力下放的直接结果:公司平面化。考虑到知识型员工的首要任务,决定选择何种工具实施数据仓库,变得越来越重要。
为了满足知识型员工的不同需求,Oracle提供了一套独特而完整的商业最终用户访问工具。
Oracle Discovere?是最终用户查询、报告、深入/旋转和Web公布工具,能够帮助用户迅速访问关系型数据仓库,从而使他们作出基于充分信息的决策。
Express Analyzer?是最终用户OLAP分析和Web访问工具,能够提供复杂的分析能力,其中包括猜测、建模和假如-怎样分析。
Express Objects?是OLAP开发工具,与Express Analyzer紧密地集成在一起。