新書推薦:
《
乾隆制造
》
售價:HK$
87.4
《
资治通鉴臣光曰辑存 资治通鉴目录(司马光全集)(全二册)
》
售價:HK$
304.4
《
明代社会变迁时期生活质量研究
》
售價:HK$
316.2
《
律令国家与隋唐文明
》
售價:HK$
76.7
《
紫云村(史杰鹏笔下大唐小吏的生死逃亡,新历史主义小说见微之作,附赠5张与小说内容高度契合的宣纸彩插)
》
售價:HK$
98.6
《
现代吴语的研究(中华现代学术名著3)
》
售價:HK$
65.0
《
天下的当代性:世界秩序的实践与想象(新版)
》
售價:HK$
77.3
《
德国天才4:断裂与承续
》
售價:HK$
109.8
|
內容簡介: |
围绕基于本体的环境保护档案数据挖掘方法问题,首先说明其研究背景与意义、国内外研究现状;然后详细研究基于本体的环保档案数据挖掘相关方法,主要包括:环境保护本体原型与构建方法、基于本体的环保档案文本信息抽取方法及表格信息抽取方法、基于本体的环保档案多层空间关联规则挖掘方法;接着对环保档案数据挖掘系统构建关键技术进行介绍;再对环保档案信息抽取系统及相关实验进行阐述;最后对上述内容进行总结和展望。
|
關於作者: |
2012.7-至今中国科学院地理科学与资源研究所地理信息系统博士后2010.3-2012.6中国科学院地理科学与资源研究所地理信息系统客座博士研究生2009.9-2010.2武汉大学地理信息系统博士研究生2007.9-2009.7武汉大学地理信息系统硕士研究生2003.9-2007.7武汉大学地理信息系统本科
|
目錄:
|
第1章 绪论1
1.1 环境保护档案概述1
1.1.1 环境保护档案的内容1
1.1.2 环境保护档案的种类3
1.1.3 环境保护档案的特点4
1.2 环保档案的重要作用及其数据挖掘的需求5
1.2.1 环境保护档案的重要作用5
1.2.2 环境保护档案数据挖掘的迫切需求7
1.3 本体、文本信息抽取及空间数据挖掘研究现状8
1.3.1 本体研究现状8
1.3.2 文本信息抽取研究现状13
1.3.3 空间数据挖掘研究现状15
1.4 数据挖掘与相近领域的关系18
1.5 环境保护档案数据挖掘研究的主要内容20
1.5.1 环境保护本体研究20
1.5.2 环境保护档案的信息抽取方法研究21
1.5.3 环境保护信息的空间数据挖掘方法探讨22
1.5.4 环境保护档案数据挖掘原型系统构建与应用实践23
第2章 环境保护本体24
2.1 环境保护本体的定义24
2.1.1 本体的定义与分类25
2.1.2 环境保护本体的定义30
2.2 环境保护本体的结构32
2.2.1 环境保护本体的逻辑构成32
2.2.2 环境保护本体的概念框架35
2.3 环境保护本体的构建方法39
2.3.1 环境保护本体的构建原则39
2.3.2 环境保护本体的构建过程41
2.3.3 环境保护本体的描述语言46
2.3.4 环境保护本体的构建工具49
第3章 环境保护档案文本信息抽取方法52
3.1 信息抽取的关键问题52
3.1.1 信息抽取的主要任务52
3.1.2 文本的表示模型55
3.1.3 语义单元的粒度57
3.1.4 中文文本的自动分词58
3.2 信息抽取方法分析60
3.2.1 基于自然语言处理的信息抽取方法61
3.2.2 基于规则方式的信息抽取方法61
3.2.3 基于统计学习的信息抽取方法63
3.3 基于本体和隐马尔可夫模型的 自由文本信息抽取方法64
3.3.1 隐马尔可夫模型64
3.3.2 基于本体和隐马尔可夫模型的自由文本信息抽取思路67
3.3.3 基于本体和隐马尔可夫模型的自由文本信息抽取实现方法68
3.3.4 应用案例分析72
3.4 基于本体和语义相似度的 表格信息抽取方法75
3.4.1 语义相似度及其计算方法76
3.4.2 基于本体和语义相似度的表格信息抽取思路80
3.4.3 基于本体和语义相似度的表格信息抽取实现方法82
3.4.4 应用案例分析85
第4章 环境保护档案空间关联规则挖掘方法88
4.1 空间关联规则挖掘89
4.1.1 空间关联规则及其分类89
4.1.2 空间关联挖掘的过程模型92
4.1.3 空间关联规则挖掘的算法93
4.2 环境保护档案的空间信息 及其概念层次关系96
4.2.1 环境保护档案的空间信息及特点96
4.2.2 环境保护空间信息中的空间关系及其描述模型98
4.2.3 环境保护档案空间信息的概念层次关系102
4.3 基于本体的环境保护档案多层 空间关联规则挖掘方法105
4.3.1 基于本体的环保档案多层空间关联规则挖掘思路105
4.3.2 基于本体的环境保护档案多层空间关联规则挖掘实现步骤107
4.4 环境保护档案多层空间关联规则挖掘分析111
4.4.1 火电厂与配套设施的多层距离关联规则挖掘112
4.4.2 火电厂与居民点空气污染物浓度的多层方位关联规则挖掘113
第5章 环境保护档案数据挖掘实践117
5.1 环境保护本体构建117
5.1.1 火电行业建设项目环境影响评价本体设计118
5.1.2 火电建设项目环境影响评价本体的实现120
5.2 火电建设项目环境影响报告 数据挖掘原型系统设计126
5.2.1 系统总体架构126
5.2.2 系统功能体系128
5.2.3 系统开发环境130
5.3 火电建设项目环境影响报告数据 挖掘系统关键技术实现131
5.3.1 基于VSTO的文本档案数据处理技术实现131
5.3.2 基于本体和ICTCLAS的中文文本分词技术实现139
5.3.3 基于Jena的本体解析与推理技术实现144
5.4 环境保护档案数据挖掘及效果分析149
5.4.1 环境保护档案数据挖掘的数据范围149
5.4.2 环境保护档案数据挖掘的结果展示150
5.4.3 环境保护档案数据挖掘的效果分析152
第6章 环境保护档案数据挖掘总结与展望155
6.1 环境保护档案数据挖掘总结155
6.2 环境保护档案数据挖掘展望158
附录A 火电行业建设项目环境影响评价本体核心概念OWL描述160
参考文献177
|
內容試閱:
|
在环境污染和生态破坏日益严峻的形势下,开展环境保护活动显得尤为重要,而环境保护活动无疑需要大量环境保护相关信息作为支撑,环境保护档案作为环境保护部门在环境保护活动中直接形成的有价值的各种形式的历史记录,其中含有大量能够为环境管理和环境保护工作提供强有力支撑的有用信息,充分利用这些信息将会对环境保护工作的开展起到无可估量的促进和支撑作用。
环境保护工作开展多年以来,虽已经积累产生了大量的环境保护档案数据,但目前对这些数据资源的利用还停留在以全文检索和查阅浏览为主的初级阶段,环境保护档案数据资源还没有得到深度的开发,在环境保护档案中真正有用的关键数据没有被单独抽取出来集中管理,隐含在关键数据背后的深层次有用信息还没有被挖掘出来加以利用,环境保护档案在环境保护活动中应有的价值没能得到充分的发挥。然而,要抽取环境保护档案中的关键数据并挖掘关键数据中隐含信息,需要相应的数据挖掘理论技术方法作为指导。
数据挖掘于20世纪被提出,用来发现隐藏在大量数据中的有用知识,以解决数据丰富,信息贫乏的问题。传统的数据挖掘主要用于发现大型事务数据库中人们事先不知道的、潜在有用的知识,但随着研究的深入,目前数据挖掘的处理对象已从事务数据拓展到文本数据、空间数据、多媒体数据等其他类型的数据,各类数据挖掘已经得到研究者们的广泛关注并在资源环境、信息安全、图书情报和金融证券等重要领域中得到了成功的应用。环境保护档案主要以文本档案为主,可以借鉴现有的文本数据挖掘方法开展关键数据的挖掘工作,但即便如此,文本数据的高度非结构性和一般文本信息挖掘方法的领域依赖性以及环境保护信息本身高度的复杂性,使得常规的文本数据挖掘方法在处理环境保护文本档案数据时的适用性不强,换言之,环境保护档案数据挖掘目前缺少具有针对性的数据挖掘理论技术方法。
本体又称为本体论,在西方哲学中也被称为存在论,是指世界的本原,20世纪末,哲学本体论被人工智能和信息科学等领域引入到各自领域的研究中,用来作为抽象概念以及概念之间关系的规范性描述,本体作为一种能够提供领域共同知识的交流工具,目前已经在地理科学、农业科学、生物医药、电子商务等科学和领域中得到了广泛的研究与应用。从本质上来讲,本体是一种描述概念世界的模型,是一种实现知识表达与组织管理的有效工具,本体的这一本质特征也使得其非常适合于表达复杂的环境保护知识。
在以上背景下,本书结合本体的相关理论和技术,介绍环境保护档案数据挖掘的理论方法,并以火电建设项目环境影响报告的数据挖掘为例开展相关实践,可以促进环保档案开发利用及相关教学与研究工作。
首先,从理论角度来讲,提出环境保护本体,可以为后续环境保护领域的知识表示与组织、信息集成与共享利用等研究工作提供参考;介绍基于本体的环境保护档案数据挖掘方法,可以丰富和完善数据挖掘理论体系,扩大数据挖掘理论在环境保护领域中的应用范围。其次,从技术角度来讲,利用现有的本体和数据挖掘开发工具,构建环境保护档案数据挖掘原型系统并开展挖掘实践,可以解决环境保护档案数据挖掘的关键技术问题,能够为今后开展环境保护档案数据挖掘提供技术支撑。最后,从应用角度来讲,介绍环境保护档案数据挖掘的理论方法并开展相应实践,促进环境保护档案中关键信息的快速获取,提升环境保护档案在环境保护中的信息支撑作用,进而更好地保护好人类共同生存和发展的环境具有重要现实意义。
本书内容组织如下。
第1章:绪论。概述环境保护档案的内容、种类和特点,阐明环境保护档案的重要作用及其对数据挖掘的迫切需求,总结本体和数据挖掘的研究现状,提出环境保护档案数据挖掘的研究内容。
第2章:环境保护本体。阐述环境保护本体的定义和结构框架,指出环境保护本体构建的方法,包括应遵循的原则和过程,应采用的本体语言和构建工具等。
第3章:环境保护档案文本信息抽取方法。介绍文本信息抽取中的几个关键问题,归纳文本信息抽取的三类主要方法,指出其各自的优势与问题,分别介绍一种基于本体和隐马尔可夫模型的自由文本信息抽取方法与一种基于本体和语义相似度的表格信息抽取方法,并以火电建设项目环境影响报告为例,分别说明这两种方法的具体应用情景。
第4章:环境保护档案空间关联规则挖掘方法。介绍空间关联规则挖掘的基本理论论述环境保护档案空间信息中的概念层次关系,指明环境保护档案中信息的空间维和属性维的概念层次结构,阐述基于本体的环境保护档案多层空间关联规则挖掘方法,详细描述方法的思路和具体实现步骤,最后以火电建设项目环境影响报告为例,介绍方法的具体应用情景。
第5章:环境保护档案数据挖掘实践。以火电建设项目环境影响报告为例,设计构建环境保护本体并加以构建实现,设计环境保护档案数据挖掘系统的总体架构、功能体系、开发环境,解决系统实现中的关键技术问题,编码实现系统原型,并开展环境保护档案数据挖掘实践。
第6章:环境保护档案数据挖掘总结与展望。总结环境保护档案数据挖掘理论研究与实践的主要成果和创新点,并做研究展望。
本书的编写和出版得到了以下项目的资助,它们是环保公益性行业科研专项项目(200909110)、国家自然科学基金项目(41371381)、科技基础性工作专项项目(2013FY110900)、国家地球系统科学数据共享平台(2005DKA32300)和江苏省地理信息资源开发与利用协同创新中心建设项目,在此特别表示感谢!
|
|