新書推薦:
《
先进电磁屏蔽材料——基础、性能与应用
》
售價:HK$
221.8
《
可转债投资实战
》
售價:HK$
99.7
《
王氏之死(新版,史景迁成名作)
》
售價:HK$
54.9
《
敢为天下先:三年建成港科大
》
售價:HK$
77.3
《
长高食谱 让孩子长高个的饮食方案 0-15周岁儿童调理脾胃食谱书籍宝宝辅食书 让孩子爱吃饭 6-9-12岁儿童营养健康食谱书大全 助力孩子身体棒胃口好长得高
》
售價:HK$
47.0
《
身体自愈力:解决内在病因的身体智慧指南
》
售價:HK$
98.6
《
非言语沟通经典入门:影响人际交往的重要力量(第7版)
》
售價:HK$
123.1
《
山西寺观艺术壁画精编卷
》
售價:HK$
1680.0
|
編輯推薦: |
全书分导论、方法论和进阶应用三大部分,共10章,涵盖数据分析的数据预处理、关联规则分析方法、有标签的数据分析方法、无标签的数据分析方法、数据可视化技术、深度学习技术、Hadoop大数据分布式应用计算平台等基础知识。
本书内容以大数据分析流程为导引,结合一系列案例和学生竞赛作品,将数据分析技术的应用过程,由浅入深地把理论融入实践,激发读者浓厚的学习热情,加深读者对知识的认识、理解和掌握。
全书所有案例均采用Python语言编写,不仅包括简单程序的代码,也包括较大应用程序代码,所有代码都全部经过验证,适合初学者学习和实现。案例代码可以登录清华大学出版社网站(http://www.tup.com.cn)下载。
可作为高等院校以及高职高专学校的计算机科学与技术、数据科学与技术、人工智能、智能科学与技术等相关信息类专业的教材,也可作为学习数据分析应用技术的参考书使用。
本书是一流本科线上课程《大数据分析与处理》在线微视频开放课程的配套教材,也是重庆市一流本科线上线下混合式课程《数据挖掘基础》的配套教材。
|
內容簡介: |
本书围绕大数据背景下的数据挖掘及应用技术,从大数据挖掘的基本概念入手,由浅入深、循序渐进地介绍大数据挖掘分析过程中的数据认知与预处理、数据可视化技术、数据挖掘的基本方法、Hadoop大数据分布式处理生态系统及分析应用等内容。其中数据挖掘的基本方法不仅包括数据关联分析、数据分类分析及数据聚类分析,还包括深度学习等重要的数据挖掘研究和发展主题。作者对每一章的内容都尽量从不同的角度进行深入剖析,案例均采用Python语言编程。 本书既可以面向计算机科学与技术、数据科学与技术、人工智能、智能科学与技术等信息类专业的本科生和研究生,也可以面向广大的IT从业人员。全书不仅提供了全部案例的Python源代码,还提供了丰富的习题和参考文献,对读者掌握大数据挖掘及应用领域的基本知识和进一步研究都具有参考价值。
|
關於作者: |
王国胤,主编,主讲本科生及研究生课程多门。出版专著4部,主编教材1部。发表计算机教育教学论文7篇、科学研究论文300多篇。主持1项重庆市重大教改项目、1项国家自然科学基金重点项目、1项科技部重点研发计划和多项国家自然科学家基金面上项目
|
目錄:
|
第1章大数据挖掘及应用概论1
1.1大数据挖掘及应用的背景1
1.1.1从“小”到“大”的数据分析处理1
1.1.2大数据的智能分析与挖掘2
1.1.3大数据4
1.1.4云计算5
1.2大数据挖掘的发展及挑战7
1.2.1大数据的发展催生三元空间世界7
1.2.2大数据挖掘分析处理面临的挑战9
1.3数据挖掘概述11
1.3.1数据挖掘的概念11
1.3.2数据挖掘的功能11
1.3.3数据挖掘运用的技术13
1.3.4大数据挖掘与传统数据挖掘的关系13
1.3.5数据分析过程的5个原则14
1.4大数据挖掘分析处理框架15
1.4.1大数据挖掘计算平台框架16
1.4.2大数据挖掘处理流程20
1.5小结22
1.6习题23
1.7参考文献24
第2章数据认知与预处理25
2.1数据挖掘的定义和流程26
2.1.1如何理解和描述数据挖掘的问题26
2.1.2数据获取与准备27
2.1.3数据质量评估28
2.2数据类型28
2.2.1属性的定义29
|
|