数据仓库初探

2008-04-09 04:04:42来源:互联网 阅读 ()

新老客户大回馈,云服务器低至5折


随着企业数据量的增多
数据仓库技术也开始在国内使用

以下是它的一篇介绍

数据仓库初探

 
摘要:作为数据库技术的一个新的发展方向,BW技术与DB技术的结合产生的集成、一致的环境,将使企业在决策中更快地获得更准确的信息。本文着重阐述了数据仓库的基本概念、特征和体系结构,并介绍了使BW作用得以发挥的决策支持工具。
关键词:数据仓库 体系结构 决策支持工具



Abstract: As a new progressing direction of database technology,the combination of DW technology and DB technology leads to a integrated and consistent environment ,which makes it faster for enterprises to avail precise information during making decisions . In this paper , the basic conceptions and characters of DW are introduced .It summarizes and expands the architecture of DW . It also introduces decision supporting implementations , which guarantee the effect of DW .


Keyword: Data Warehouse , Architecture of Data Warehouse,Decision Supporting Implementation

无双 回复于:2003-08-03 17:23:28 1 引言

在市场经济的激烈竞争中,企业必须把业务经营同市场需求联系起来,在此基础上作出科学、正确的决策,以求生存。为此,企业纷纷建立起了自己的数据库系统,由计算机管理代替手工操作,以此来收集、存贮、管理业务操作数据,改善办公环境,提高操作人员的工作效率。然而,传统的数据库应用系统并不能很好地支持决策。由于传统的数据库应用系统是面向业务操作设计的,简化了具体操作人员的劳动强度,而企业的中高层领导却没有相应的系统。企业需要新的技术来弥补原有数据库系统的不足,需要把已经广泛收集到的数据集成到数据仓库中,以便从业务数据中提取有用的信息,帮助他们在业务管理和发展上作出即时、正确的判断。数据仓库应运而生,成为信息技术领域非常热门的话题之一。
数据仓库的目的是要建立一种体系化的数据存贮环境,将分析决策所需的大量数据从传统的操作环境中分离出来,使分散的、不一致的操作数据转换成集成的、统一的信息,企业内不同单位的成员都可以在此单一的环境之下,通过运用其中的数据与信息,发现全新的视野和新的问题、新的分析与想法,进而发展出制度化的决策系统,并获取更多经营效益。

无双 回复于:2003-08-03 17:25:24 2 什么是数据仓库

社会的需求和计算机技术的不断发展,人们开始尝试对原来数据库中的数据进行再加工,形成一个综合的、面向分析的环境,以支持科学决策的产生。由此,数据仓库的思想、技术、产品逐渐开始形成。对于什么是数据仓库,许多人提出了不同的看法。数据仓库概念的创始人W.H.Inmon在《建立数据仓库》一书中指出:"数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持经营管理中的决策制定过程。[1][3][4][5]
虽然还没有形成统一的定义,但以上观点都或多或少地指出了数据仓库有以下几个特点:数据仓库中的数据是面向主题的、集成的、不可更新的(稳定的)、随时间不断变化的,建立数据仓库的目的是为了更好的支持决策的制定。

1)、面向主题
主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象,是针对某一决策问题而设置的。面向主题的数据组织方式,就是在较高层次上对分析对象的数据的一个完整的、统一的、一致的描述,能完整、统一地刻画各个分析对象所涉及的企业的各项数据,以及数据之间的联系。[1]
目前,数据仓库的实现主要是基于关系数据库,每个主题由一组关系表或逻辑视图实现。这些表和视图的内容与原来各个运行系统数据源的数据本质上是一致的,但为了方便支持分析数据处理,对数据结构进行了重组,其中还可能会增加一些数据冗余。


2)、集成的数据
数据仓库中存贮的数据是从原来分散的各个子系统中提取出来的,但并不是原有数据的简单拷贝,而是经过统一、综合。其一,数据仓库的数据不能直接从原有数据库系统中得到。原有数据库系统记录的是每一项业务处理的流水帐,这些数据不适合于分析处理,在进入数据仓库之前必须经过综合、计算,抛弃分析处理不需要的数据项,增加一些可能涉及的外部数据。其二,数据仓库每一个主题所对应的源数据在原分散数据库中有许多重复或不一致的地方,必须将这些数据转换成全局统一的定义,消除不一致和错误的地方,以保证数据的质量。否则,对不准确,甚至不正确的数据分析得出的结果将不能用于指导企业作出科学的决策。
对源数据的集成是数据仓库建设中最关键,也是最复杂的一步。



3)、数据不可更新
从数据的使用方式上看,数据仓库的数据不可更新,这是指当数据被存放到数据仓库中以后,最终用户只能通过分析工具进行查询、分析,而不能修改其中存贮的数据,也就是说,数据仓库的数据对最终用户而言是只读的。由于数据仓库的查询数据量往往很大,所以对数据查询、查询界面的友好和数据的表示提出了很高提出了更高的要求,因为对数据仓库进行查询分析的用户多是企业的高层领导,他们是所在领域的专家,但对计算机却不一定熟悉。
从数据的内容上看,数据仓库存贮的是企业当前的和历史的数据,在一定的时间间隔以后,当前的数据需要按一定的方法转换成历史数据,年代久远的、查询率低的数据的需要从数据仓库脱离到廉价慢速设备(如磁带)上,对分析处理不再有用的数据需要从数据仓库中删除。但这些工作是由系统管理员来做,或由系统自动完成。因此,也可以说数据仓库在一定时间间隔内是稳定的。

4)、数据随时间不断变化
数据仓库数据的不可更新是针对应用而言,即用户进行分析处理时不对数据进行更新操作,但不是说,数据从进入数据仓库以后就永远不变。数据仓库中的数据随时间变化而定期地被更新,每隔一段固定的时间间隔后,运作数据库系统中产生的数据被抽取、转换以后集成到数据仓库中,而数据的过去版本仍被保留在数据仓库中,如同"定期摄影术",每隔一周、一月或适当的间隔就照一张像;随着时间的变化,数据以更高的综合层次被不断综合,以适应趋势分析的要求;当数据超过数据仓库的存储期限,或对分析不在有用时,这些数据将从数据仓库中删去。

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:XP 精华--如何使 Java 项目获得更大成功

下一篇:ISO软件工程模板