登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書

『簡體書』决策支持系统教程(第3版)

書城自編碼: 2990875
分類:簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 陈文伟
國際書號(ISBN): 9787302467595
出版社: 清华大学出版社
出版日期: 2017-06-01
版次: 3 印次: 1
頁數/字數: 307/472000
書度/開本: 32开 釘裝: 平装

售價:HK$ 56.6

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
鲍勃·迪伦为什么重要
《 鲍勃·迪伦为什么重要 》

售價:HK$ 78.2
超负荷的女性:看见内心的渴望与恐惧
《 超负荷的女性:看见内心的渴望与恐惧 》

售價:HK$ 67.9
数学史(第三版) 国际数学史领域具有影响力的名著
《 数学史(第三版) 国际数学史领域具有影响力的名著 》

售價:HK$ 181.7
接纳真实的自我(日本超人气禅师小池龙之介力作!"与自己和解"指南!)
《 接纳真实的自我(日本超人气禅师小池龙之介力作!"与自己和解"指南!) 》

售價:HK$ 67.9
敦煌及周边区域荒漠植物图鉴
《 敦煌及周边区域荒漠植物图鉴 》

售價:HK$ 78.2
吴哥王朝兴亡史(方尖碑)
《 吴哥王朝兴亡史(方尖碑) 》

售價:HK$ 79.4
夜幕之下.6:神祸降临
《 夜幕之下.6:神祸降临 》

售價:HK$ 63.3
叶锦添自传:向前迈进的日子(奥斯卡艺术指导获得者 叶锦添 50多年的人生经历,近40年的从业经历,向前迈进,步履不停)
《 叶锦添自传:向前迈进的日子(奥斯卡艺术指导获得者 叶锦添 50多年的人生经历,近40年的从业经历,向前迈进,步履不停) 》

售價:HK$ 148.4

 

編輯推薦:
本书详细描述了决策支持系统的五个阶段:基本决策支持系统、智能决策支持系统、数据仓库型决策支持系统、综合决策支持系统和网络环型决策支持系统。本书增加了云计算与大数据的决策支持内容,云计算为存储大数据提供了支持,为分析大数据提供了工具。大数据是为决策服务的,不但为领导者提供决策支持,也开创了为个人提供决策支持,从而开创了决策支持新时代。本书作者从1987年开始到现在一直从事决策支持系统(DSS)的研究和开发,得到过国家863计划;八五、九五、十五等国防预研项目和国家自然科学基金项目的资助。取得了系列的科研成果:研制出了决策支持系统开发工具GFKD-DSS和专家系统工具TOES。1分布式多媒体智能决策支持系统开发平台DM-IDSSP、基于客户服务器的决策支持系统快速开发平台CSDSSP。
內容簡介:
"决策支持系统在于实现科学决策。它是在计算机上利用决策资源(模型、知识、数据)制订方案,为决策者提供有效决策的技术手段。随着大数据和云计算的出现,网络上的决策资源更为丰富,这为决策支持系统的应用和发展带来新的机遇,也为个人决策提供了更多的信息。因此,本书在第2版的基础上增加了这方面的内容。本书系统叙述决策支持系统发展过程中的基本决策支持系统、智能决策支持系统、数据仓库型决策支持系统、综合决策支持系统和网络型决策支持系统的原理、技术和实例,并介绍云计算和大数据的决策支持以及决策支持系统开发的计算思维。书中展现了决策支持系统结构和运行方式之间的关系,并通过实例进行说明,便于读者掌握决策支持系统原理和应用。
本书可作为高等院校信息管理与信息系统专业、计算机专业、管理类专业本科生和研究生的教材,也可作为计算机应用开发人员的参考书。"
目錄
目录
第1章决策支持系统综述1
1.1决策支持系统的形成1
1.1.1管理信息系统1
1.1.2管理科学运筹学3
1.1.3决策支持系统4
1.1.4专家系统5
1.1.5智能决策支持系统5
1.1.6数据仓库型决策支持系统7
1.1.7综合决策支持系统9
1.1.8网络型决策支持系统9
1.2决策支持系统的概念10
1.2.1决策问题的结构化分类10
1.2.2决策支持系统的定义11
1.2.3决策支持系统与管理科学运筹学的关系12
1.2.4决策支持系统与管理信息系统的关系12
1.2.5几个典型的决策支持系统13
1.3决策科学与决策支持系统17
1.3.1决策与决策科学17
1.3.2决策过程与决策支持系统20
1.3.3决策体系与决策支持系统24
1.3.4决策支持系统的技术基础26
习题129
第2章决策资源与决策支持30
2.1决策资源30
2.1.1数据资源30
2.1.2模型资源32
2.1.3知识资源39
2.2决策支持44
2.2.1决策支持的概念44
2.2.2决策资源的决策支持44
2.2.3决策方案的决策支持50
2.3模型实验的决策支持51
2.3.1模型的建立与WhatIf分析52
2.3.2模型组的决策支持54
2.4模型组合方案的决策支持55
2.4.1经济优化方案的决策支持55
2.4.2产品优化方案的决策支持57
2.4.3多模型辅助决策系统61
习题262
第3章决策支持系统64
3.1决策支持系统结构64
3.1.1决策支持系统结构形式64
3.1.2决策支持系统的结构比较71
3.1.3决策支持系统统一的基本结构形式72
3.2决策支持系统的数据部件与综合部件73
3.2.1数据库系统在决策支持系统中的作用73
3.2.2人机交互与问题综合系统78
3.2.3决策支持系统的综合部件83
3.3模型库系统84
3.3.1模型库84
3.3.2模型库的组织和存储87
3.3.3模型库管理系统89
3.4组合模型的决策支持系统93
3.4.1模型组合技术93
3.4.2模型组合的程序设计95
3.4.3决策支持系统的决策支持96
3.5决策支持系统实例97
3.5.1物资申请和库存的计划汇总97
3.5.2制定物资的分配方案98
3.5.3物资调拨预处理99
3.5.4制定物资运输方案100
3.5.5制定物资调拨方案101
3.5.6物资分配调拨决策支持系统结构与决策支持101
3.5.7复杂化学系统多尺度模型实例104
习题3104
第4章智能决策支持系统106
4.1专家系统的决策支持106
4.1.1专家系统的原理106
4.1.2产生式规则专家系统108
4.1.3建模专家系统111
4.2神经网络的决策支持113
4.2.1神经网络原理113
4.2.2反向传播模型115
4.2.3神经网络专家系统及实例117
4.2.4神经网络的容错性121
4.3智能决策支持系统原理与实例123
4.3.1智能决策支持系统概念123
4.3.2智能决策支持系统结构124
4.3.3专家系统与决策支持系统的集成126
4.3.4智能决策支持系统实例128
习题4133
第5章数据仓库型决策支持系统135
5.1数据仓库基本原理135
5.1.1数据仓库的概念135
5.1.2数据仓库结构136
5.1.3元数据138
5.1.4数据仓库的存储139
5.1.5数据仓库系统141
5.2联机分析处理143
5.2.1基本概念143
5.2.2联机分析处理的决策支持: 多维数据分析149
5.2.3联机分析处理应用实例152
5.3数据仓库的决策支持153
5.3.1查询与报表154
5.3.2多维分析与原因分析155
5.3.3预测未来156
5.3.4实时决策156
5.3.5自动决策157
5.4数据挖掘157
5.4.1知识发现和数据挖掘的概念158
5.4.2数据挖掘的方法和技术159
5.4.3数据挖掘的知识表示163
5.5数据挖掘的决策支持165
5.5.1数据挖掘的决策支持分类165
5.5.2决策树的挖掘及其应用168
5.5.3关联规则及应用173
5.6数据仓库型决策支持系统178
5.6.1数据仓库型决策支持系统的原理和结构179
5.6.2数据仓库型决策支持系统简例180
5.6.3数据仓库型决策支持系统实例185
习题5188
第6章综合决策支持系统与网络型决策支持系统189
6.1智能决策支持系统与数据仓库型决策支持系统的开发技术189
6.1.1从基本决策支持系统到智能决策支持系统189
6.1.2智能决策支持系统的开发技术190
6.1.3数据仓库的关键技术191
6.2综合决策支持系统196
6.2.1智能决策支持系统与数据仓库型决策支持系统的特点比较196
6.2.2数据仓库与数学模型198
6.2.3综合决策支持系统原理、结构和定义199
6.3网络型决策支持系统201
6.3.1客户机服务器结构与数据库服务器201
6.3.2网络型决策支持系统的原理205
6.3.3网络型决策支持系统体系207
习题6211
第7章云计算和大数据的决策支持212
7.1云计算的决策支持212
7.1.1云计算的兴起212
7.1.2云计算的IT服务216
7.1.3云计算的决策支持218
7.2大数据的决策支持220
7.2.1大数据时代的来临220
7.2.2从数据到决策的大数据时代221
7.2.3大数据的决策支持方式226
7.3从事物相关中决策与创新228
7.3.1寻找相关事物228
7.3.2科学发现中的相关性230
7.3.3从矛盾中决策和创新233
习题7237
第8章决策支持系统开发的计算思维238
8.1软件的计算思维238
8.1.1计算思维的概念238
8.1.2软件进化中的计算思维241
8.2决策支持系统开发的计算思维251
8.2.1决策支持系统开发过程的计算思维251
8.2.2决策支持系统的实现技术257
8.2.3数据仓库开发过程的计算思维261
8.3决策支持系统开发工具与实例的计算思维266
8.3.1网络型决策支持系统快速开发平台CSDSSP266
8.3.2网络型决策支持系统实例274
8.3.3网络型决策支持系统的分析对比277
习题8278
附录A各章习题中部分问答题参考答案279
附录B部分章习题中设计题和计算题答案295
內容試閱
第5章数据仓库型决策支持系统20世纪90年代中期,国外兴起了3项决策支持新技术,即数据仓库、联机分析处理(OLAP)和数据挖掘(DM)。数据仓库是在数据库的基础上发展起来的,把数据的组织由二维平面结构扩充到多维空间结构,用于决策分析。联机分析处理提出了多维数据分析方法。数据挖掘则是在人工智能机器学习中发展起来的,它是从数据库或数据仓库中发现知识(KDD)的核心。数据仓库、联机分析处理、数据挖掘的结合形成了基于数据仓库的决策支持系统。5.1数据仓库基本原理数据仓库是W.H.Inmon在《建立数据仓库》(Building the Data Warehouse)中提出的。数据仓库的提出是以关系数据库,并行处理和分布式技术的飞速发展为基础的信息新技术。从目前的形势看,数据仓库技术已紧跟Internet而上,成为信息社会中获得企业竞争优势的又一关键技术。5.1.1数据仓库的概念[*2]1. 数据仓库的定义1) W.H.Inmon对数据仓库的定义数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理中的决策制定过程。2) SAS软件研究的观点数据仓库是一种管理技术,旨在通过通畅、合理、全面的信息管理,达到有效的决策支持。传统数据库用于事务处理,也称为操作型处理,是指对数据库联机进行日常操作,即对一个或一组记录的查询和修改,主要为企业特定的应用服务。用户关心的是响应时间、数据的安全性和完整性。数据仓库用于决策支持,也称为分析型处理,用于决策分析,它是建立决策支持系统的基础。操作型数据与分析型数据的对比如表5.1所示。表5.1操作型数据与分析型数据对比表操作型数据分析型数据操作型数据分析型数据细节的综合或提炼的事务驱动分析驱动代表当前的数据代表过去的数据面向应用面向分析可更新的不更新一次操作数据量小一次操作数据量大操作需求事先可知道操作需求事先不知道支持管理业务支持决策分析例如,银行的用户有储蓄,又有贷款,还有信用卡。这些数据存放在不同业务处彼此独立的数据库中。现在,把这3个数据库集中起来建立数据仓库,就便利对用户的整体分析,容易决定是否继续对用户贷款或发放信用卡。2. 数据仓库的特点数据仓库有如下特点。1) 数据仓库是面向主题的主题是数据归类的标准,每一个主题基本对应一个宏观的分析领域。例如,保险公司的数据仓库的主题为客户、政策、保险金、索赔等。基于应用的数据库则完全不同,它的数据只是为处理具体应用而组织在一起的。保险公司按应用来组织数据库为汽车保险、生命保险、健康保险、伤亡保险等。2) 数据仓库是集成的数据进入数据仓库之前,必须经过加工与集成。对不同的数据来源进行数据结构和编码的统一。统一原始数据中的所有矛盾之处,如字段的同名异义、异名同义、单位不统一、字长不一致等。总之,将原始数据结构做一个从面向应用到面向主题的大转变。3) 数据仓库是稳定的数据仓库中包括了大量的历史数据。数据经集成进入数据仓库后是极少或根本不更新的。4) 数据仓库是随时间变化的数据仓库内的数据时限在5~10年,故数据的键码包含时间项,标明数据的历史时期,这适合决策支持系统进行时间趋势分析。而数据库只包含当前数据,即存取某一时间的正确的有效的数据。5) 数据仓库中的数据量很大通常的数据仓库的数据量为10GB级,相当于一般数据库100MB的100倍,大型数据仓库是1TB(1000GB)级。数据仓库中数据的比重为索引和综合数据占23,原始数据占13。6) 数据仓库软硬件要求较高既需要一个巨大的硬件平台,又需要一个并行的数据库系统。5.1.2数据仓库结构数据仓库是在原有关系型数据库基础上发展形成的,但不同于数据库系统的组织结构形式,它从原有的业务数据库中获得的基本数据和综合数据被分成一些不同的层次(levels)。一般数据仓库的结构组成如图5.1所示,包括当前基本数据(current detail data)、历史基本数据(older detail data)、轻度综合数据(lightly summarized data)、高度综合数据(highly summarized data)和元数据(meta data)。图5.1数据仓库结构图当前基本数据是最近时期的业务数据,是数据仓库用户最感兴趣的部分,数据量大。当前基本数据随时间的推移,由数据仓库的时间控制机制转为历史基本数据,一般被转存于介质中,如磁带等。轻度综合数据是从当前基本数据中提取出来的,设计这层数据结构时会遇到综合处理数据的时间段选取,综合数据包含哪些数据属性(attributes)和内容(contents)等问题。最高一层是高度综合数据层,这一层的数据十分精练,是一种准决策数据。整个数据仓库的组织结构是由元数据来组织的,它不包含任何业务数据库中的实际数据信息。元数据在数据仓库中扮演了重要的角色,它被用在以下几种用途。(1) 定位数据仓库的目录作用。(2) 数据从业务环境向数据仓库环境传送时数据仓库的目录内容。(3) 指导从当前基本数据到轻度综合数据,轻度综合数据到高度综合数据的综合方法。元数据至少包括以下一些信息: 数据结构(the structure of the data);用于综合的方法(the algorithms used for summarization);从业务环境到数据仓库的规划(the mapping from the operation to the data warehouse)。例如,当前基本数据层存放的是20152016年销售细节数据,历史数据层存放的20102014年的销售细节数据,轻度综合数据层存放20152016年的每周销售数据,高度综合数据层存放20152016年的每月销售数据。数据仓库的工作范围和成本常常是巨大的。建造数据仓库需要对所有的用户的任何一次决策需求进行分析,从而使数据仓库的开发成本高、时间长。于是,提供更紧密集成的、拥有完整图形接口并且价格吸引人的工具数据集市(Data Marts就应运而生了。数据集市是一种更小、更集中的数据仓库,为公司提供分析商业数据的一条廉价途径。目前,全世界对数据仓库总投资的一半以上均集中在数据集市上。数据集市不等于数据仓库,多个数据集市简单合并起来不能成为数据仓库。数据集市的特性: ①规模小; ②特定的应用; ③面向部门; ④由业务部门定义、设计和开发; ⑤由业务部门管理和维护; ⑥快速实现; ⑦购买较便宜; ⑧投资快速回收; ⑨可升级到完整的数据仓库。数据仓库是企业级的,能为整个企业的运行提供决策支持手段;而数据集市则是部门级的,一般只能为某个部门内的管理人员服务,因此也称之为部门级数据仓库。数据集市有两种,即从属的数据集市Dependent Data Mart和独立的数据集市Independent Data Mart。1) 从属数据集市从属数据集市的逻辑结构如图5.2所示。所谓从属,是指它的数据直接来自于中央数据仓库。显然,这种结构仍能保持数据的一致性。一般为那些访问数据仓库十分频繁的关键业务部门建立从属的数据集市,这样可以很好地提高查询的反应速度。2) 独立数据集市独立数据集市的逻辑结构如图5.3所示。图5.2从属数据集市结构图5.3独立数据集市结构独立数据集市的数据直接来源于各生产系统。许多企业在计划实施数据仓库时,往往出于投资方面的考虑,最后建成独立数据集市,用来解决个别部门比较迫切的决策问题。从这个意义上讲,它和企业数据仓库除了在数据量大小和服务对象上有所区别外,逻辑结构并无多大区别,这是把数据集市称为部门数据仓库的主要原因。5.1.3元数据元数据是数据仓库的重要组成部分。元数据描述了数据仓库的数据和环境,即关于数据的数据(data about data)。元数据可分为4类,分别为: 关于数据源的元数据、关于数据模型的元数据、关于数据仓库映射的元数据和关于数据仓库使用的元数据。元数据就相当于数据库系统中的数据字典。由于数据仓库与数据库有很大的不同,因此元数据的作用远不是数据字典所能相比的。元数据在数据仓库中有着举足轻重的作用,它不仅定义了数据仓库有什么,指明了数据仓库中信息的内容和位置,刻画了数据的抽取和转换规则,存储了与数据仓库主题有关的各种商业信息,而且整个数据仓库的运行都是基于元数据的,如数据的修改、跟踪、抽取、装入、综合等。1. 关于数据源的元数据它是现有的业务系统的数据源的描述信息。这类元数据是对不同平台上的数据源的物理结构和含义的描述。具体如下。(1) 数据源中所有的物理数据结构,包括所有的数据项及数据类型。(2) 所有数据项的业务定义。2. 关于数据模型的元数据这类元数据描述了数据仓库中有什么数据以及数据之间的关系,它们是用户管理数据仓库的基础。这类元数据可以支持用户从数据仓库中获取数据。3. 关于数据仓库映射的元数据这类元数据是数据源与数据仓库数据之间的映射。当数据源中的一个数据项与数据仓库建立了映射关系,就应该记下这些数据项发生的任何变换或变动,即用元数据反映数据仓库中的数据项是从哪个特定的数据源来的,经过哪些抽取、转换和加载过程。从源系统的数据到数据仓库中的目标数据的转移是一项复杂的工作,其工作量占整个数据仓库开发的70%。4. 关于数据仓库使用的元数据这类元数据是数据仓库中信息的使用情况描述。数据仓库的用户最关心的是两类元数据。(1) 元数据告诉数据仓库中有什么数据,它们从哪里来,即如何按主题查看数据仓库的内容。(2) 元数据提供已有的可重复利用的查询语言信息。如果某个查询能够满足用户的需求,或者与用户的愿望相似,用户就可以再次使用那些查询而不必从头开始编程。关于数据仓库使用的元数据能帮助用户到数据仓库中查询所需要的信息,用于解决企业问题。5.1.4数据仓库的存储数据仓库不同于数据库。数据仓库存储的数据模型是数据的多维视图,它直接影响前端工具和联机分析处理的查询引擎。图5.4数据仓库数据的存储示意图
在多维数据模型中,一部分数据是数量值,如销售量、投资额、收入等。而这些数量值是依赖于一组维的,这些维提供了数量值的上下文关系。例如,销售量与城市、商品名称、销售时间有关,这些相关的维唯一决定了这个销售数量值。因此,多维数据视图就是这些由多个维构成的多维空间中存放着数量值。数据仓库数据的存储示意图如图5.4所示,图中的小格内存储的数据可以假设为商品的销售量。多维数据模型的另一个特点是对一个或多个维所做的集合运算。例如,对总销售量按城市进行统计和排序。这些运算还包括对于同样维所限定的数量值的比较(如销售与预算)。一般来说,时间维是一个有特殊意义的维,它对决策中的趋势分析很重要。对于逻辑上的多维数据模型,可以使用不同的存储机制和表示模式来实现多维数据模型。目前,使用的多维数据模型主要有星形模型、雪花模型、星网模型等。1. 星形模型大多数的数据仓库都采用星形模型。星形模型是由事实表(大表)以及多个维表(小表)所组成。事实表中存放大量关于企业的事实数据(数量数据)。通常都很大,而且非规范化程度很高。例如,多个时期的数据可能会出现在同一个表中。维表中存放描述性数据,维表是围绕事实表建立的较小的表。图5.5所示的是一个星形数据模型实例。图5.5星形数据模型实例事实表有大量的行(记录),然而维表相对来说有较少的行(记录)。星形模型存取数据速度快,主要在于针对各个维做了大量的预处理,如按照维进行预先的统计、分类、排序等,如按照汽车的型号、颜色、代理商进行预先的销售量统计,作报表时速度会很快。2. 雪花模型雪花模型是对星形模型的扩展,雪花模型对星形模型的维表进一步层次化,原来的各维表可能被扩展为小的事实表,形成一些局部的层次区域。它的优点是最大限度地减少数据存储量,以及把较小的维表联合在一起来改善查询性能。在上面星形模型的数据中,对产品表日期表地区表进行扩展形成雪花模型数据,如图5.6所示。使用数据仓库的工具完成一些简单的二维或三维查询,既满足了用户对复杂的数据仓库查询的需求,又能够完成一些简单查询功能而不用访问过多的数据。图5.6雪花数据模型实例3. 星网模型星网模型是将多个星形模型连接起来形成网状结构。多个星形模型通过相同的维,如时间维,连接多个事实表。5.1.5数据仓库系统数据仓库系统由数据仓库、仓库管理和分析工具3部分组成,其结构形式如图5.7所示。图5.7数据仓库系统结构图数据仓库的数据来源于多个数据源。源数据包括企业内部数据、市场调查报告以及各种文档之类的外部数据。1. 数据仓库管理系统在确定数据仓库信息需求之后,首先进行数据建模,确定从源数据到数据仓库的数据抽取、清理和转换过程,划分维数以及确定数据仓库的物理存储结构。元数据是数据仓库的核心,它用于存储数据模型,定义数据结构、转换规划、仓库结构、控制信息等。仓库的管理包括对数据的安全、归档、备份、维护、恢复等工作,这些工作需通过数据仓库管理系统DWMS来完成。数据仓库管理系统由以下几部分组成。1) 定义部分定义部分用于定义和建立数据仓库系统。它包括设计和定义数据仓库的数据库、定义数据来源、确定从源数据向数据仓库复制数据时的清理和增强规则。2) 数据获取部分该部件把数据从源数据中提取出来,依定义部件的规则,抽取、转换和装载数据进入数据仓库。3) 管理部分它用于管理数据仓库的工作,包括对数据仓库中数据的管理、将仓库数据取出给分布的DSS用户、对仓库数据的安全、归档、备份、恢复等处理工作。4) 目录部分数据仓库的目录数据是元数据,由以下3方面组成。(1) 技术目录: 由定义部分生成,关于数据源、目标、清理规则、变换规则以及数据源和仓库之间的映像信息。(2) 业务目录: 由仓库管理员生成,包括仓库数据的来源及当前值、预定义的查询和报表细节、合法性要求等。(3) 信息引导器: 使用户容易访问仓库数据。包括查询和引导功能,利用固定查询或建立新的查询,生成暂时的或永久的仓库数据集合的能力等。该部分是数据仓库使用能力的关键因素。5 数据库管理系统部分数据仓库的存储形式仍为关系型数据库,因此需要利用数据库管理系统。由于数据仓库含大量的数据,要求数据库管理系统产品提供高速性能。2. 数据仓库工具集由于数据仓库的数据量大,必须有一套功能很强的分析工具集来实现从数据仓库中提供辅助决策的信息,完成决策支持的各种要求。分析工具集包括以下两类工具。1) 查询工具数据仓库的查询不是指对记录级数据的查询,而是指对分析要求的查询。一般包括以下两类工具。(1) 可视化工具: 以图形化方式展示数据,可以帮助了解数据的结构、关系以及动态性。(2) 多维分析工具(OLAP工具): 通过对信息的多种可能的观察形式进行快速、一致和交互性的存取,这样便于用户对数据进行深入的分析和观察。多维数据的每一维代表对数据的一个特定的观察视角,如时间、地域、商品等。2) 挖掘工具从大量数据中挖掘具有规律性的知识,需要利用数据挖掘(Data Mining)工具。3. 数据仓库的运行结构数据仓库应用是一个典型的客户服务器(CS)结构形式。数据仓库采用服务器结构,客户端所做的工作有: 客户交互、格式化查询、结果显示、报表生成等。服务器端完成各种辅助决策的SQL查询、复杂的计算和各类综合功能等。现在,越来越普通的一种形式是3层CS结构形式,即在客户与数据仓库服务器之间增加一个多维数据分析服务器,如图5.8所示。图5.8数据仓库应用的3层CS结构多维数据分析服务器将加强和规范化决策支持的服务工作,集中和简化了原客户端和数据仓库服务器的部分工作,降低了系统数据传输量。这种结构形式工作效率更高。5.2联机分析处理联机分析处理(On Line Analytical Processing,OLAP)的概念最早是由关系数据库之父E.F.Codd于1993年提出的。当时,Codd认为随着企业数据量的急剧增加,联机事务处理已经不能满足终端用户对数据库查询分析的需要,决策分析需要对关系数据库进行大量的计算才能得到结果,而且查询的结果并不能满足决策者所提出的问题。因此Codd提出了多维数据库和多维分析的概念,即多维数据分析的概念。在数据仓库系统中,联机分析处理是重要的数据分析工具,它的基本思想是企业的决策者应能灵活地操纵企业的数据,从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化。5.2.1基本概念近十几年来,人们利用信息技术生产和收集数据的能力大幅度提高,大量的数据库被用于商业管理、政府办公、科学研究和工程开发等,这一势头仍将持续发展下去。于是,一个新的挑战被提了出来: 在信息爆炸时代,如何才能不被信息的汪洋大海所淹没,从中及时发现有用的知识或者规律,提高信息利用率呢?要想使数据真正成为一个决策资源,只有充分利用它为一个组织的业务决策和战略发展服务才行,否则大量的数据可能成为包袱,甚至成为垃圾。联机分析处理是解决这类问题的最有力工具之一。联机分析处理专门设计用于支持复杂的分析操作,侧重对分析人员和高层管理人员的要求,快速、灵活地进行大数据量的复杂查询处理,并且以一种直观易懂的形式将查询结果提供给决策制定人,以便他们准确掌握企业(公司)的经营状况,了解市场需求,制定正确方案,增加效益。联机分析处理软件以它先进的分析功能和多维形式提供数据的能力,正作为一种支持企业关键商业决策的解决方案而迅速崛起。1. 联机分析处理的定义在决策活动中,决策人员需要的数据往往不是单一指标的值,他们希望能够从多个角度观察某个指标或者某个值,或者找出这些指标之间的关系。例如,决策者可能想知道东北地区和西南地区今年一季度和去年一季度在销售总额上的对比情况,并且销售额按10万~50万元、50万~100万元,以及100万元以上分组。上面的问题是比较有代表性的,决策所需数据总是与一些统计指标如销售总额、观察角度(如销售区域、时间)和不同级别的统计有关,我们将这些观察数据的角度称之为维。可以说决策数据是多维数据,多维数据分析是决策分析的主要内容。但传统的关系数据库系统及其查询工具对于管理和应用这样复杂的数据显得力不从心。联机分析处理是在联机事务处理的基础上发展起来的,联机事务处理是以数据库为基础的,面对的是操作人员和低层管理人员,在网络上对基本数据的查询和增、删、改等进行处理。而联机分析处理是以数据仓库为基础的数据分析处理。它有两个特点: 一是在线联机(On Line),体现为对用户请求的快速响应和交互式操作,它的实现是由客户机服务器这种体系结构来完成的;二是多维分析(Multidimension Analysis),这也是联机分析处理的核心所在。联机分析处理超越了联机事务处理的查询和报表的功能,它的决策支持能力更强。在多维数据环境中,联机分析处理为终端用户提供了复杂的数据分析功能。通过联机分析处理,高层管理人员能够通过浏览、分析数据去发现数据的变化趋势、特征以及一些潜在的信息,从而更好地帮助他们了解商业活动的变化。目前,比较普遍接受的联机分析处理的定义有两种。1) 联机分析处理理事会给出的定义联机分析处理是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面(维,即坐标)观察信息,以达到深入理解数据的目的。这些信息是从原始数据转换过来的,按照用户的理解,它反映了企业真实的方方面面(多维)。企业用户的观点要求数据是多维的。拿销售来说,不仅可从生产这方面看,还与地点、时间等有关,这就是为什么要求联机分析处理模型是多维的原因。这种多维用户视图通过一种更为直观的分析模型进行分析和设计。联机分析处理的大部分策略都是将关系型的或普通的数据进行多维数据存储,以便于进行分析,从而达到联机分析处理的目的。这种多维数据库,也被看成超立方体。沿着各个维方向存储数据,它允许用户沿事物的维的要求能方便地分析数据。2) 联机分析处理的简单定义近年来,随着人们对联机分析处理理解的不断深入,有些学者提出了更为简要的定义,第3版前言决策支持系统在于实现科学决策。它和管理信息系统、专家系统构成了信息系统的三大支柱。管理信息系统是社会中管理领域的基础技术,使计算机走向了社会;专家系统使人工智能走向了实用,奠定了人工智能发展的基础;决策支持系统是决策科学的基础,为科学决策提供了有力支撑。决策支持系统从兴起到现在共三十多年的发展,已经历了基本决策支持系统、智能决策支持系统、数据仓库型决策支持系统、综合决策支持系统和网络型决策支持系统5个阶段。基本决策支持系统以模型库系统为核心,以多模型和数据库的组合形成方案辅助决策,开创了用计算机技术实现科学决策的时代。智能决策支持系统把基本决策支持系统和专家系统结合起来,提高了辅助决策的效果。专家系统的概念比决策支持系统的概念出现得更早和更成熟,实质上起到了代替人类专家进行决策的效果,以定性方式辅助决策。基本决策支持系统是在运筹学单模型辅助决策的基础上发展起来的,突出的是定量方式辅助决策。智能决策支持系统强化了定量和定性相结合的辅助决策的效果。数据仓库型决策支持系统是20世纪90年代兴起的,以数据仓库的大量数据为基础,结合多维数据分析以及数据挖掘技术,起到了有效的辅助决策效果。当时这股旋风有代替传统决策支持系统(智能决策支持系统)的势头。但是,它和传统决策支持系统走的两条路不可能覆盖。因此,把数据仓库型决策支持系统和智能决策支持系统结合起来的综合决策支持系统成为了决策支持系统发展新方向。目前,在开发的数据仓库型决策支持系统中,也在通过逐渐增加数学模型来提高辅助决策的效果。随着互联网技术的发展,网络型决策支持系统随之兴起。数据仓库型决策支持系统的数据仓库和数据挖掘都已经以服务器形式在网络上提供服务了。目前,各类数据库也已经采用服务器形式,再使模型库和知识库也以服务器形式在网络上提供服务,这样自然就形成了网络型决策支持系统。网络的最大好处就在于,它能为大家提供大量的共享资源,包括决策资源(模型、知识、数据等),这就会为开发决策支持系统带来极大的便利。开发者只需在自己的客户端上按决策问题的要求,编制总控制程序,调用网络上所需要的决策资源,组合成解决问题的方案,并在网络上运行,即可完成网络型决策支持系统的辅助决策。这种新技术对于改变方案或者提出多个方案都是很容易完成的。它为决策支持系统的发展起了极大的推动作用。本书较第2版增加了云计算与大数据的决策支持内容。云计算为存储大数据提供了支持,为分析大数据提供了工具。大数据是为决策服务的,不但为领导者提供决策支持,也开创了为个人提供决策支持,从而开创了决策支持新时代。本书对第2版中技术性较强的内容做了较大的压缩和修改,使内容更通俗易懂。书中增加了各章的部分习题答案。这些答案涉及决策支持系统与计算机有关的知识。附录A是思考题的参考答案,起到开拓思路的作用;附录B是设计题和计算题的答案。希望学生通过决策支持系统课程的学习,能够自行设计决策支持系统方案,即能够画出决策支持系统流程图,特别是总控制流程是如何调用模型和数据组成方案的。这样,学生就基本上掌握了决策支持系统的原理与应用。本书作者从1987年开始到现在一直从事决策支持系统(DSS)的研究和开发,得到国家863计划、八五九五十五等国防预研项目和国家自然科学基金项目的资助,并取得了一系列的科研成果: 1989年研制出决策支持系统开发工具(GFKDDSS)和专家系统工具(TOES);1995年研制出分布式多媒体智能决策支持系统开发平台(DMIDSSP);1999年研制出基于客户机服务器的决策支持系统快速开发平台(CSDSSP)。这样,GFKDDSS工具的单机上的模型库系统上升到网络上的CSDSSP平台的广义模型服务器,从而可以在网络上为多个客户端提供模型服务和知识服务;GFKDDSS工具的集成语言编制DSS总控程序,上升到网络上客户端的可视化系统生成工具,能够快速地制作应用系统的框架流程,既能够可视化运行应用系统,又可快速改变系统方案,大大提高了决策支持效果。我们又利用Web Services技术,在异构环境下(开发语言差异、平台差异、通信协议差异和数据表示差异),开发了新的网络型决策支持系统,这使得DSS的开发不受异构环境的影响,使决策支持能力更强。我们在研究云计算和大数据时,不但感觉到大数据对国家和大企业决策的重要性,也感觉到大数据对个人决策的价值,这主要体现在相关信息对于个人决策时的作用。三十多年来在决策支持系统的研究中,参加科研项目并做出贡献的有陈亮、张明安、罗端红、陆飙、杨桂聪、曹泽文、赵东升、胡爱国、黄金才、赵新昱、何义、钟鸣、邹雯、马建军、赛英、高人伯、赵健、刘钢等同志和廖建文老师。他们的工作丰富了本书的内容,也深化了对决策支持系统的论识。我和他们共同为我国决策支持系统的发展,做出了积极的贡献。清华大学出版社对本书的出版给予了极大支持,在此表示感谢。
陈文伟2017年1月


第5章数据仓库型决策支持系统20世纪90年代中期,国外兴起了3项决策支持新技术,即数据仓库、联机分析处理(OLAP)和数据挖掘(DM)。数据仓库是在数据库的基础上发展起来的,把数据的组织由二维平面结构扩充到多维空间结构,用于决策分析。联机分析处理提出了多维数据分析方法。数据挖掘则是在人工智能机器学习中发展起来的,它是从数据库或数据仓库中发现知识(KDD)的核心。数据仓库、联机分析处理、数据挖掘的结合形成了基于数据仓库的决策支持系统。5.1数据仓库基本原理数据仓库是W.H.Inmon在《建立数据仓库》(Building the Data Warehouse)中提出的。数据仓库的提出是以关系数据库,并行处理和分布式技术的飞速发展为基础的信息新技术。从目前的形势看,数据仓库技术已紧跟Internet而上,成为信息社会中获得企业竞争优势的又一关键技术。5.1.1数据仓库的概念[*2]1. 数据仓库的定义1) W.H.Inmon对数据仓库的定义数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理中的决策制定过程。2) SAS软件研究的观点数据仓库是一种管理技术,旨在通过通畅、合理、全面的信息管理,达到有效的决策支持。传统数据库用于事务处理,也称为操作型处理,是指对数据库联机进行日常操作,即对一个或一组记录的查询和修改,主要为企业特定的应用服务。用户关心的是响应时间、数据的安全性和完整性。数据仓库用于决策支持,也称为分析型处理,用于决策分析,它是建立决策支持系统的基础。操作型数据与分析型数据的对比如表5.1所示。表5.1操作型数据与分析型数据对比表操作型数据分析型数据操作型数据分析型数据细节的综合或提炼的事务驱动分析驱动代表当前的数据代表过去的数据面向应用面向分析可更新的不更新一次操作数据量小一次操作数据量大操作需求事先可知道操作需求事先不知道支持管理业务支持决策分析例如,银行的用户有储蓄,又有贷款,还有信用卡。这些数据存放在不同业务处彼此独立的数据库中。现在,把这3个数据库集中起来建立数据仓库,就便利对用户的整体分析,容易决定是否继续对用户贷款或发放信用卡。2. 数据仓库的特点数据仓库有如下特点。1) 数据仓库是面向主题的主题是数据归类的标准,每一个主题基本对应一个宏观的分析领域。例如,保险公司的数据仓库的主题为客户、政策、保险金、索赔等。基于应用的数据库则完全不同,它的数据只是为处理具体应用而组织在一起的。保险公司按应用来组织数据库为汽车保险、生命保险、健康保险、伤亡保险等。2) 数据仓库是集成的数据进入数据仓库之前,必须经过加工与集成。对不同的数据来源进行数据结构和编码的统一。统一原始数据中的所有矛盾之处,如字段的同名异义、异名同义、单位不统一、字长不一致等。总之,将原始数据结构做一个从面向应用到面向主题的大转变。3) 数据仓库是稳定的数据仓库中包括了大量的历史数据。数据经集成进入数据仓库后是极少或根本不更新的。4) 数据仓库是随时间变化的数据仓库内的数据时限在5~10年,故数据的键码包含时间项,标明数据的历史时期,这适合决策支持系统进行时间趋势分析。而数据库只包含当前数据,即存取某一时间的正确的有效的数据。5) 数据仓库中的数据量很大通常的数据仓库的数据量为10GB级,相当于一般数据库100MB的100倍,大型数据仓库是1TB(1000GB)级。数据仓库中数据的比重为索引和综合数据占23,原始数据占13。6) 数据仓库软硬件要求较高既需要一个巨大的硬件平台,又需要一个并行的数据库系统。5.1.2数据仓库结构数据仓库是在原有关系型数据库基础上发展形成的,但不同于数据库系统的组织结构形式,它从原有的业务数据库中获得的基本数据和综合数据被分成一些不同的层次(levels)。一般数据仓库的结构组成如图5.1所示,包括当前基本数据(current detail data)、历史基本数据(older detail data)、轻度综合数据(lightly summarized data)、高度综合数据(highly summarized data)和元数据(meta data)。图5.1数据仓库结构图当前基本数据是最近时期的业务数据,是数据仓库用户最感兴趣的部分,数据量大。当前基本数据随时间的推移,由数据仓库的时间控制机制转为历史基本数据,一般被转存于介质中,如磁带等。轻度综合数据是从当前基本数据中提取出来的,设计这层数据结构时会遇到综合处理数据的时间段选取,综合数据包含哪些数据属性(attributes)和内容(contents)等问题。最高一层是高度综合数据层,这一层的数据十分精练,是一种准决策数据。整个数据仓库的组织结构是由元数据来组织的,它不包含任何业务数据库中的实际数据信息。元数据在数据仓库中扮演了重要的角色,它被用在以下几种用途。(1) 定位数据仓库的目录作用。(2) 数据从业务环境向数据仓库环境传送时数据仓库的目录内容。(3) 指导从当前基本数据到轻度综合数据,轻度综合数据到高度综合数据的综合方法。元数据至少包括以下一些信息: 数据结构(the structure of the data);用于综合的方法(the algorithms used for summarization);从业务环境到数据仓库的规划(the mapping from the operation to the data warehouse)。例如,当前基本数据层存放的是20152016年销售细节数据,历史数据层存放的20102014年的销售细节数据,轻度综合数据层存放20152016年的每周销售数据,高度综合数据层存放20152016年的每月销售数据。数据仓库的工作范围和成本常常是巨大的。建造数据仓库需要对所有的用户的任何一次决策需求进行分析,从而使数据仓库的开发成本高、时间长。于是,提供更紧密集成的、拥有完整图形接口并且价格吸引人的工具数据集市(Data Marts就应运而生了。数据集市是一种更小、更集中的数据仓库,为公司提供分析商业数据的一条廉价途径。目前,全世界对数据仓库总投资的一半以上均集中在数据集市上。数据集市不等于数据仓库,多个数据集市简单合并起来不能成为数据仓库。数据集市的特性: ①规模小; ②特定的应用; ③面向部门; ④由业务部门定义、设计和开发; ⑤由业务部门管理和维护; ⑥快速实现; ⑦购买较便宜; ⑧投资快速回收; ⑨可升级到完整的数据仓库。数据仓库是企业级的,能为整个企业的运行提供决策支持手段;而数据集市则是部门级的,一般只能为某个部门内的管理人员服务,因此也称之为部门级数据仓库。数据集市有两种,即从属的数据集市Dependent Data Mart和独立的数据集市Independent Data Mart。1) 从属数据集市从属数据集市的逻辑结构如图5.2所示。所谓从属,是指它的数据直接来自于中央数据仓库。显然,这种结构仍能保持数据的一致性。一般为那些访问数据仓库十分频繁的关键业务部门建立从属的数据集市,这样可以很好地提高查询的反应速度。2) 独立数据集市独立数据集市的逻辑结构如图5.3所示。图5.2从属数据集市结构图5.3独立数据集市结构独立数据集市的数据直接来源于各生产系统。许多企业在计划实施数据仓库时,往往出于投资方面的考虑,最后建成独立数据集市,用来解决个别部门比较迫切的决策问题。从这个意义上讲,它和企业数据仓库除了在数据量大小和服务对象上有所区别外,逻辑结构并无多大区别,这是把数据集市称为部门数据仓库的主要原因。5.1.3元数据元数据是数据仓库的重要组成部分。元数据描述了数据仓库的数据和环境,即关于数据的数据(data about data)。元数据可分为4类,分别为: 关于数据源的元数据、关于数据模型的元数据、关于数据仓库映射的元数据和关于数据仓库使用的元数据。元数据就相当于数据库系统中的数据字典。由于数据仓库与数据库有很大的不同,因此元数据的作用远不是数据字典所能相比的。元数据在数据仓库中有着举足轻重的作用,它不仅定义了数据仓库有什么,指明了数据仓库中信息的内容和位置,刻画了数据的抽取和转换规则,存储了与数据仓库主题有关的各种商业信息,而且整个数据仓库的运行都是基于元数据的,如数据的修改、跟踪、抽取、装入、综合等。1. 关于数据源的元数据它是现有的业务系统的数据源的描述信息。这类元数据是对不同平台上的数据源的物理结构和含义的描述。具体如下。(1) 数据源中所有的物理数据结构,包括所有的数据项及数据类型。(2) 所有数据项的业务定义。2. 关于数据模型的元数据这类元数据描述了数据仓库中有什么数据以及数据之间的关系,它们是用户管理数据仓库的基础。这类元数据可以支持用户从数据仓库中获取数据。3. 关于数据仓库映射的元数据这类元数据是数据源与数据仓库数据之间的映射。当数据源中的一个数据项与数据仓库建立了映射关系,就应该记下这些数据项发生的任何变换或变动,即用元数据反映数据仓库中的数据项是从哪个特定的数据源来的,经过哪些抽取、转换和加载过程。从源系统的数据到数据仓库中的目标数据的转移是一项复杂的工作,其工作量占整个数据仓库开发的70%。4. 关于数据仓库使用的元数据这类元数据是数据仓库中信息的使用情况描述。数据仓库的用户最关心的是两类元数据。(1) 元数据告诉数据仓库中有什么数据,它们从哪里来,即如何按主题查看数据仓库的内容。(2) 元数据提供已有的可重复利用的查询语言信息。如果某个查询能够满足用户的需求,或者与用户的愿望相似,用户就可以再次使用那些查询而不必从头开始编程。关于数据仓库使用的元数据能帮助用户到数据仓库中查询所需要的信息,用于解决企业问题。5.1.4数据仓库的存储数据仓库不同于数据库。数据仓库存储的数据模型是数据的多维视图,它直接影响前端工具和联机分析处理的查询引擎。图5.4数据仓库数据的存储示意图
在多维数据模型中,一部分数据是数量值,如销售量、投资额、收入等。而这些数量值是依赖于一组维的,这些维提供了数量值的上下文关系。例如,销售量与城市、商品名称、销售时间有关,这些相关的维唯一决定了这个销售数量值。因此,多维数据视图就是这些由多个维构成的多维空间中存放着数量值。数据仓库数据的存储示意图如图5.4所示,图中的小格内存储的数据可以假设为商品的销售量。多维数据模型的另一个特点是对一个或多个维所做的集合运算。例如,对总销售量按城市进行统计和排序。这些运算还包括对于同样维所限定的数量值的比较(如销售与预算)。一般来说,时间维是一个有特殊意义的维,它对决策中的趋势分析很重要。对于逻辑上的多维数据模型,可以使用不同的存储机制和表示模式来实现多维数据模型。目前,使用的多维数据模型主要有星形模型、雪花模型、星网模型等。1. 星形模型大多数的数据仓库都采用星形模型。星形模型是由事实表(大表)以及多个维表(小表)所组成。事实表中存放大量关于企业的事实数据(数量数据)。通常都很大,而且非规范化程度很高。例如,多个时期的数据可能会出现在同一个表中。维表中存放描述性数据,维表是围绕事实表建立的较小的表。图5.5所示的是一个星形数据模型实例。图5.5星形数据模型实例事实表有大量的行(记录),然而维表相对来说有较少的行(记录)。星形模型存取数据速度快,主要在于针对各个维做了大量的预处理,如按照维进行预先的统计、分类、排序等,如按照汽车的型号、颜色、代理商进行预先的销售量统计,作报表时速度会很快。2. 雪花模型雪花模型是对星形模型的扩展,雪花模型对星形模型的维表进一步层次化,原来的各维表可能被扩展为小的事实表,形成一些局部的层次区域。它的优点是最大限度地减少数据存储量,以及把较小的维表联合在一起来改善查询性能。在上面星形模型的数据中,对产品表日期表地区表进行扩展形成雪花模型数据,如图5.6所示。使用数据仓库的工具完成一些简单的二维或三维查询,既满足了用户对复杂的数据仓库查询的需求,又能够完成一些简单查询功能而不用访问过多的数据。图5.6雪花数据模型实例3. 星网模型星网模型是将多个星形模型连接起来形成网状结构。多个星形模型通过相同的维,如时间维,连接多个事实表。5.1.5数据仓库系统数据仓库系统由数据仓库、仓库管理和分析工具3部分组成,其结构形式如图5.7所示。图5.7数据仓库系统结构图数据仓库的数据来源于多个数据源。源数据包括企业内部数据、市场调查报告以及各种文档之类的外部数据。1. 数据仓库管理系统在确定数据仓库信息需求之后,首先进行数据建模,确定从源数据到数据仓库的数据抽取、清理和转换过程,划分维数以及确定数据仓库的物理存储结构。元数据是数据仓库的核心,它用于存储数据模型,定义数据结构、转换规划、仓库结构、控制信息等。仓库的管理包括对数据的安全、归档、备份、维护、恢复等工作,这些工作需通过数据仓库管理系统DWMS来完成。数据仓库管理系统由以下几部分组成。1) 定义部分定义部分用于定义和建立数据仓库系统。它包括设计和定义数据仓库的数据库、定义数据来源、确定从源数据向数据仓库复制数据时的清理和增强规则。2) 数据获取部分该部件把数据从源数据中提取出来,依定义部件的规则,抽取、转换和装载数据进入数据仓库。3) 管理部分它用于管理数据仓库的工作,包括对数据仓库中数据的管理、将仓库数据取出给分布的DSS用户、对仓库数据的安全、归档、备份、恢复等处理工作。4) 目录部分数据仓库的目录数据是元数据,由以下3方面组成。(1) 技术目录: 由定义部分生成,关于数据源、目标、清理规则、变换规则以及数据源和仓库之间的映像信息。(2) 业务目录: 由仓库管理员生成,包括仓库数据的来源及当前值、预定义的查询和报表细节、合法性要求等。(3) 信息引导器: 使用户容易访问仓库数据。包括查询和引导功能,利用固定查询或建立新的查询,生成暂时的或永久的仓库数据集合的能力等。该部分是数据仓库使用能力的关键因素。5 数据库管理系统部分数据仓库的存储形式仍为关系型数据库,因此需要利用数据库管理系统。由于数据仓库含大量的数据,要求数据库管理系统产品提供高速性能。2. 数据仓库工具集由于数据仓库的数据量大,必须有一套功能很强的分析工具集来实现从数据仓库中提供辅助决策的信息,完成决策支持的各种要求。分析工具集包括以下两类工具。1) 查询工具数据仓库的查询不是指对记录级数据的查询,而是指对分析要求的查询。一般包括以下两类工具。(1) 可视化工具: 以图形化方式展示数据,可以帮助了解数据的结构、关系以及动态性。(2) 多维分析工具(OLAP工具): 通过对信息的多种可能的观察形式进行快速、一致和交互性的存取,这样便于用户对数据进行深入的分析和观察。多维数据的每一维代表对数据的一个特定的观察视角,如时间、地域、商品等。2) 挖掘工具从大量数据中挖掘具有规律性的知识,需要利用数据挖掘(Data Mining)工具。3. 数据仓库的运行结构数据仓库应用是一个典型的客户服务器(CS)结构形式。数据仓库采用服务器结构,客户端所做的工作有: 客户交互、格式化查询、结果显示、报表生成等。服务器端完成各种辅助决策的SQL查询、复杂的计算和各类综合功能等。现在,越来越普通的一种形式是3层CS结构形式,即在客户与数据仓库服务器之间增加一个多维数据分析服务器,如图5.8所示。图5.8数据仓库应用的3层CS结构多维数据分析服务器将加强和规范化决策支持的服务工作,集中和简化了原客户端和数据仓库服务器的部分工作,降低了系统数据传输量。这种结构形式工作效率更高。5.2联机分析处理联机分析处理(On Line Analytical Processing,OLAP)的概念最早是由关系数据库之父E.F.Codd于1993年提出的。当时,Codd认为随着企业数据量的急剧增加,联机事务处理已经不能满足终端用户对数据库查询分析的需要,决策分析需要对关系数据库进行大量的计算才能得到结果,而且查询的结果并不能满足决策者所提出的问题。因此Codd提出了多维数据库和多维分析的概念,即多维数据分析的概念。在数据仓库系统中,联机分析处理是重要的数据分析工具,它的基本思想是企业的决策者应能灵活地操纵企业的数据,从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化。5.2.1基本概念近十几年来,人们利用信息技术生产和收集数据的能力大幅度提高,大量的数据库被用于商业管理、政府办公、科学研究和工程开发等,这一势头仍将持续发展下去。于是,一个新的挑战被提了出来: 在信息爆炸时代,如何才能不被信息的汪洋大海所淹没,从中及时发现有用的知识或者规律,提高信息利用率呢?要想使数据真正成为一个决策资源,只有充分利用它为一个组织的业务决策和战略发展服务才行,否则大量的数据可能成为包袱,甚至成为垃圾。联机分析处理是解决这类问题的最有力工具之一。联机分析处理专门设计用于支持复杂的分析操作,侧重对分析人员和高层管理人员的要求,快速、灵活地进行大数据量的复杂查询处理,并且以一种直观易懂的形式将查询结果提供给决策制定人,以便他们准确掌握企业(公司)的经营状况,了解市场需求,制定正确方案,增加效益。联机分析处理软件以它先进的分析功能和多维形式提供数据的能力,正作为一种支持企业关键商业决策的解决方案而迅速崛起。1. 联机分析处理的定义在决策活动中,决策人员需要的数据往往不是单一指标的值,他们希望能够从多个角度观察某个指标或者某个值,或者找出这些指标之间的关系。例如,决策者可能想知道东北地区和西南地区今年一季度和去年一季度在销售总额上的对比情况,并且销售额按10万~50万元、50万~100万元,以及100万元以上分组。上面的问题是比较有代表性的,决策所需数据总是与一些统计指标如销售总额、观察角度(如销售区域、时间)和不同级别的统计有关,我们将这些观察数据的角度称之为维。可以说决策数据是多维数据,多维数据分析是决策分析的主要内容。但传统的关系数据库系统及其查询工具对于管理和应用这样复杂的数据显得力不从心。联机分析处理是在联机事务处理的基础上发展起来的,联机事务处理是以数据库为基础的,面对的是操作人员和低层管理人员,在网络上对基本数据的查询和增、删、改等进行处理。而联机分析处理是以数据仓库为基础的数据分析处理。它有两个特点: 一是在线联机(On Line),体现为对用户请求的快速响应和交互式操作,它的实现是由客户机服务器这种体系结构来完成的;二是多维分析(Multidimension Analysis),这也是联机分析处理的核心所在。联机分析处理超越了联机事务处理的查询和报表的功能,它的决策支持能力更强。在多维数据环境中,联机分析处理为终端用户提供了复杂的数据分析功能。通过联机分析处理,高层管理人员能够通过浏览、分析数据去发现数据的变化趋势、特征以及一些潜在的信息,从而更好地帮助他们了解商业活动的变化。目前,比较普遍接受的联机分析处理的定义有两种。1) 联机分析处理理事会给出的定义联机分析处理是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面(维,即坐标)观察信息,以达到深入理解数据的目的。这些信息是从原始数据转换过来的,按照用户的理解,它反映了企业真实的方方面面(多维)。企业用户的观点要求数据是多维的。拿销售来说,不仅可从生产这方面看,还与地点、时间等有关,这就是为什么要求联机分析处理模型是多维的原因。这种多维用户视图通过一种更为直观的分析模型进行分析和设计。联机分析处理的大部分策略都是将关系型的或普通的数据进行多维数据存储,以便于进行分析,从而达到联机分析处理的目的。这种多维数据库,也被看成超立方体。沿着各个维方向存储数据,它允许用户沿事物的维的要求能方便地分析数据。2) 联机分析处理的简单定义近年来,随着人们对联机分析处理理解的不断深入,有些学者提出了更为简要的定义,

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.