新書推薦:
《
美国小史(揭秘“美国何以成为美国”,理解美国的经典入门读物)
》
售價:HK$
81.4
《
中国古代北方民族史丛书——东胡史
》
售價:HK$
87.8
《
巨人传(插图珍藏本)
》
售價:HK$
705.6
《
地下(村上春树沙林毒气事件的长篇纪实)
》
售價:HK$
76.7
《
偿还:债务与财富的阴暗面
》
售價:HK$
80.2
《
清华大学藏战国竹简校释(壹):《命训》诸篇
》
售價:HK$
94.4
《
封建社会农民战争问题导论(光启文库)
》
售價:HK$
68.4
《
虚弱的反攻:开禧北伐
》
售價:HK$
92.0
|
內容簡介: |
本书介绍了异构信息网络挖掘的原理和方法,包括基于排名的聚类与分类、基于元路径的相似性搜索和挖掘、关系强度感知挖掘,以及若干有前景的研究方向。本书是伊利诺伊大学香槟分校数据挖掘高级课程的参考教材,适合作为数据挖掘方向的研究生教材,也适合数据挖掘研究人员和专业技术人员参考。
|
關於作者: |
Yizhou Sun拥有伊利诺伊大学厄巴纳-尚佩恩分校计算机系博士学位,师从著名数据挖掘科学家Jiawei Han(韩家炜)教授。目前是西北大学计算机和信息科学学院副教授。
Jiawei Han(韩家炜) 伊利诺伊大学厄巴纳-尚佩恩分校计算机科学系Bliss教授。由于在数据挖掘和数据库系统领域卓有成效的研究工作,他曾多次获得各种荣誉和奖励,其中包括2004年ACM SIGKDD颁发的佳创新奖,2005年IEEE Computer Society 颁发的技术成就奖,2009年IEEE颁发的W. Wallace McDowell奖。他是ACM和IEEE 会士。
|
目錄:
|
目录‖
丛书前言
译者序
摘要和关键词
第1章引言
11异构信息网络是什么
12为什么异构网络挖掘是一项新的挑战
13本书的内容组织
第一部分基于排名的聚类和分类
第2章基于排名的聚类
21概述
22RankClus算法
221排名函数
222从条件排名分布到新的聚类度量
223聚类中心和距离测量
224RankClus算法总结
225实验结果
23NetClus算法
231排名函数
232NetClus算法框架
233网络聚类中目标对象生成模型
234目标对象和属性对象的后验概率
235实验结果
第3章异构信息网络的分类
31概述
32GNetMine
321分类问题定义
322基于图的正则化框架
33RankClass
331RankClass框架
332基于图的排名
333调整网络
334后验概率计算
34实验结果
341数据集
342准确性研究
343案例研究
第二部分基于元路径的相似性搜索和挖掘
第4章基于元路径的相似性搜索
41概述
42PathSim:基于元路径的相似性度量
421网络模式和元路径
422基于元路径的相似性框架
423PathSim:全新的相似性度量
43单一元路径的在线查询处理
431单一元路径的连接
432基准算法
433基于共同聚类的剪枝
44多重元路径的组合
45实验结果
451有效性
452效率对比
453Flickr网络的案例研究
第5章基于元路径的关系预测
51概述
52基于元路径的关系预测框架
521基于元路径的拓扑特征空间
522监督式关系预测框架
53合著关系预测
531合著关系预测模型
532实验结果
54带时间的关系预测
541面向作者引用关系预测的基于元路径的拓扑特征
542关系建立时间预测模型
543实验结果
第三部分关系强度感知挖掘
第6章不完全属性的关系强度感知聚类
61概述
62关系强度感知聚类的问题定义
63聚类框架
631模型综述
632属性生成建模
633结构一致性建模
634统一模型
64聚类算法
641聚类优化
642链接类型强度学习
643整合:GenClus算法
65实验结果
651数据集
652有效性研究
第7章通过元路径选择的用户引导聚类
71概述
72用户引导聚类的元路径选择问题
721元路径选择问题
722用户引导的聚类
723问题定义
73概率模型
731关系生成建模
732用户引导建模
733对元路径选择的质量权重建模
734统一模型
74学习算法
741给定元路径权重优化聚类结果
742给定聚类结果优化元路径权重
743PathSelClus算法
75实验结果
751数据集
752有效性研究
753元路径权重的案例研究
76讨论
第8章研究前沿
参考文献
|
內容試閱:
|
丛书前言陈寅恪先生说:“ 一时代之学术,必有其新材料与新问题。取用此材料,以研求问题,则为此时代学术之新潮流。治学之士,得预于此潮流者,谓之预流(借用佛教初果之名)。其未得预者,谓之未入流。”对今天的信息技术而言,“新材料”即为大数据,而“新问题”则是产生于“新材料”之上的新的应用需求。
当下大数据技术发展变化日新月异,大数据应用已经遍及工业和社会生活方方面面,原有的数据管理理论体系与大数据产业应用之前的差距日益加大,而工业界对于大数据人才的需求却极剧增加。大数据专业人才的培养是新一轮科技较量的基础,高等院校承担着大数据人才培养的重任。因此大数据相关课程将逐渐成为国内高校计算机相关专业的重要课程。近来越来越多的院校急切地开设大数据方面的人才培养计划,以求占得“先机”。但纵观大数据人才培养课程体系尚不尽如人意,多是已有课程的“冷拼盘”,顶多是加点“调料”,原材料没有新鲜感。现阶段无论多么新多么好的人才培养计划,都只能在六七十年代编写的计算机知识体系上施教,无法把当下的大数据带给我们的新思维方式和知识体系传导给学生。
为此我们意识到,缺少基础性工作和原始积累,就难以培养符合工业界需要的大数据复合型和交叉型人才。因此急需在思维和理念方面进行转变,为现有的课程和知识体系按大数据应用需求进行延展和补充,加入新的可以因材施教的知识模块。每一位学者都有责任和义务去为此“增砖添瓦”。
在此背景下,我们策划和组织了这套大数据管理丛书,希望能够培养数据思维的理念,对原有数据管理知识体系进行完善和补充,面向新的技术热点,提出新的知识体系知识点,拉近教材体系与大数据应用的距离,为受教者应对现代技术带来的大数据领域的新问题和挑战,扫除障碍。现时要求学者编写大部头著作费时费力,不太现实。这使我们想到二十世纪八九十年代风靡一时的“五角丛书”,它短小精湛,题材丰富,选题新颖,恰到好处地迎合了那个时代人们对新知识的渴望,因此成为了那个时代的共同记忆。所以我们受此启发,选择了这种更容易实现的“五角丛书”的形式,促使学者们力所能及地把各自工作中的积累呈现给大家,为大数据人才培养的“大厦”增砖添瓦。我们相信,假以时日,这些小部头的著作汇溪成河,必将对未来大数据人才培养起到“基石”的作用。
丛书定位:面向新形势下的大数据技术发展对人才培养提出的挑战,旨在为学术研究和人才培养提供可供参考的“基石”。虽然是一些不起眼的“砖头瓦块”,但可以为大数据人才培养积累可用的新模块(新素材),弥补原有知识体系与应用问题之前的鸿沟,力图为现有的数据管理知识查漏补缺,聚少成多,最终形成适应大数据技术发展和人才培养的知识体系和教材基础。
丛书特点:丛书借鉴Morgan & Claypool Publishers出版的Synthesis Lectures on Data Management,特色在于选题新颖,短小精湛。选题新颖即面向技术热点,弥补现有知识体系的漏洞和不足(或延伸或补充),内容涵盖大数据管理的理论、方法、技术等诸多方面。短小精湛则不求系统性和完备性,但每本书要自成知识体系,重在阐述基本问题和方法,并辅以例题说明,便于施教。
丛书组织:丛书采用国际学术出版通行的主编负责制,为此特邀中国人民大学孟小峰教授(email: xfmeng@ruceducn)担任丛书主编,负责丛书的整体规划和选题。责任编辑为机械工业出版社华章分社姚蕾编辑(email:yaolei@hzbookcom)。
在此期望有志于大数据人才培养并具有丰富理论和实践经验的学者和专业人员能够加入到这套书的编写工作中来,共同为中国大数据研究和人才培养贡献自己的智慧和力量,共筑属于我们自己的“时代记忆”。欢迎读者对我们的出版工作提出宝贵意见和建议。
丛书即将出版书目大数据管理概论孟小峰 主编2017年2月出版异构信息网络挖掘:原理和方法[美]孙艺洲(Yizhou Sun)韩家炜Jiawei Han著;段磊朱敏唐常杰译2017年1月出版大规模元搜索引擎技术[美]孟卫一(Weiyi Meng)於德(Clement TYu)著;朱亮译2017年1月大数据集成[美]董欣(Xin Luna Dong)戴夫士·斯里瓦斯塔瓦(Divesh Srivastava)著;王秋月杜治娟王硕译2017年2月短文本数据理解王仲远编著2017年2月个人数据管理李玉坤孟小峰编著2017年3月位置大数据隐私保护潘晓霍峥孟小峰编著2017年3月移动大数据挖掘连德富张富峥王英子袁晶谢幸编著2017年3月云数据管理挑战与机遇[美]迪卫艾肯特·阿格拉沃尔(Divyakant Agrawal)苏迪皮托·达斯(Sudipto Das)阿姆鲁·埃尔·阿巴迪(Amr El Abbadi)著;马友忠等译2017年3月流数据管理[加]卢卡斯·戈拉布(Lukasz Golab)[德]M·塔纳·顾兹叙(MTamer zsu)著;禹晓辉译2017年3月
|
|