新書推薦:
《
写出心灵深处的故事:踏上疗愈之旅(修订版)(创意写作书系)
》
售價:HK$
66.1
《
控制权视角下的家族企业管理与传承
》
售價:HK$
87.4
《
冯友兰和青年谈心系列
》
售價:HK$
167.3
《
利他主义的生意:偏爱“非理性”的市场(英国《金融时报》推荐读物!)
》
售價:HK$
77.3
《
认知行为疗法:心理咨询的顶层设计
》
售價:HK$
99.7
《
FANUC工业机器人装调与维修
》
售價:HK$
99.7
《
吕著中国通史
》
售價:HK$
62.7
《
爱琴海的光芒 : 千年古希腊文明
》
售價:HK$
199.4
|
編輯推薦: |
经典算法、课程思政和实验实践“三位一体”,强化经典算法的理解和掌握,对经典算法做到“精”和“通”。以真实生活和科研数据作为研究对象,将理论和实践有机结合,带领读者在多个领域实践机器学习过程,透彻理解机器学习经典算法,掌握解决机器学习实际问题的最佳实践!
|
內容簡介: |
机器学习是人工智能的重要分支。本书立足实用且易于上手实践的原则,系统地介绍机器学习领域的经典算法,以及这些算法的Python实现和典型应用。本书分4部分: 第1部分介绍监督学习,包括线性模型、决策树分类、贝叶斯分类器、集成学习和支持向量机;第2部分介绍无监督学习,包括关联规则、聚类分析和数据降维;第3部分介绍深度学习,包括神经网络、深度学习和生成对抗网络;第4部分介绍强化学习。本书所介绍的经典机器学习算法及其应用案例均给出了相关实验数据和Python代码实现,每章末尾还给出了习题和实验题,便于读者巩固知识和开展课内实验。 本书可作为高等学校信息类以及相关专业高年级本科生和研究生的教材,也可供对机器学习感兴趣的工程技术人员阅读参考。
|
目錄:
|
第1章绪论/1
1.1什么是机器学习1
1.1.1机器学习的定义1
1.1.2机器学习的三要素3
1.1.3机器学习与数据挖掘3
1.2为什么要进行机器学习5
1.3机器学习的发展历程5
1.4机器学习算法9
1.4.1监督学习9
1.4.2无监督学习10
1.4.3半监督学习11
1.4.4强化学习12
1.5机器学习的应用12
1.6机器学习开发工具与框架13
1.6.1机器学习常用开发工具13
1.6.2机器学习常用框架15
1.7机器学习数据集16
习题17
第1部分监 督 学 习
第2章线性模型/212.1基本形式21
2.2线性回归22
2.3线性分类25
2.4多分类策略28
习题33
本章实验34
第3章决策树分类/35
3.1基本概念35
3.1.1什么是分类35
3.1.2分类过程36
3.1.3分类器常见的构造方法37
3.1.4决策树分类38
3.2CART算法39
3.2.1CART算法介绍39
3.2.2CART算法原理40
3.2.3CART算法实例40
3.2.4CART算法Python实现42
3.2.5CART算法的优缺点43
3.3ID3算法43
3.3.1ID3算法介绍43
3.3.2ID3算法原理44
3.3.3ID3算法实例45
3.3.4ID3算法Python实现48
3.3.5ID3的优缺点51
3.4C4.5算法52
3.4.1C4.5算法介绍52
3.4.2C4.5算法原理52
3.4.3C4.5算法实例53
3.4.4C4.5算法Python实现58
3.4.5C4.5算法的优缺点59
3.53种算法的比较59
3.6分类算法评价60
3.6.1常用术语60
3.6.2评价指标61
3.6.3分类器性能的表示62
3.6.4分类器性能的评估方法65
习题66
本章实验68
〖1〗机器学习(Python实现)目录〖3〗〖3〗第4章贝叶斯分类器/69
4.1贝叶斯理论69
4.1.1条件概率和乘法定理69
4.1.2全概率公式和贝叶斯定理70
4.1.3极大后验假设和极大似然假设70
4.2朴素贝叶斯分类算法72
4.2.1NBC算法原理72
4.2.2朴素贝叶斯分类器的特点75
4.3朴素贝叶斯分类器在破产预测中的应用76
4.3.1实验环境及数据集76
4.3.2数据处理77
4.3.3模型构建77
4.3.4模型评价分析78
4.4极大期望算法79
4.4.1极大似然估计79
4.4.2极大期望算法81
4.4.3EM算法的优缺点86
4.5EM算法求解三硬币模型参数87
4.5.1三硬币模型87
4.5.2三硬币模型Python实现87
习题89
本章实验90
第5章集成学习/91
5.1基本概念91
5.1.1算法起源91
5.1.2基本概念91
5.2Bagging算法与随机森林93
5.2.1Bagging算法93
5.2.2随机森林94
5.3Boosting算法102
5.3.1Boosting算法概述102
5.3.2AdaBoost算法103
5.3.3GBDT和XGBoost118
习题119
本章实验120
第6章支持向量机/121
6.1最大间隔分类121
6.2支持向量机模型求解123
6.3核支持向量机模型130
6.4软件间隔支持向量机135
习题140
本章实验141
第2部分无监督学习
第7章关联规则/1457.1基本概念145
7.2Apriori算法149
7.2.1Apriori算法150
7.2.2Apriori算法实例154
7.2.3Apriori算法实现157
7.2.4Apriori算法总结162
7.3FPGrowth算法163
7.3.1FPGrowth算法简介164
7.3.2FPGrowth算法实例171
7.3.3FPGrowth算法实现173
7.3.4FPGrowth算法总结178
习题178
本章实验180
第8章聚类分析/181
8.1聚类分析优化模型181
8.1.1聚类分析概念181
8.1.2聚类优化模型182
8.2基于划分的聚类算法183
8.2.1Kmeans算法183
8.2.2Kmeans算法应用: 图像减色压缩186
8.2.3Kmeans算法的优缺点188
8.3基于层次的聚类算法189
8.3.1AGNES算法190
8.3.2DIANA算法194
8.4基于密度的聚类算法198
8.4.1DBSCAN198
8.4.2OPTICS204
8.4.3DENCLUE210
8.5聚类效果评估方法211
8.5.1估计聚类趋势212
8.5.2确定簇数213
8.5.3评估聚类质量214
习题220
本章实验221
第9章数据降维/222
9.1主成分分析222
9.2线性判别分析225
9.3核线性降维229
习题234
本章实验234
第3部分深 度 学 习
第10章神经网络/23710.1人工神经网络237
10.1.1人工神经网络介绍237
10.1.2人工神经网络的发展历史237
10.2前馈神经网络239
10.2.1神经元介绍239
10.2.2网络结构243
10.2.3前馈神经网络244
10.3反向传播算法246
10.3.1梯度下降246
10.3.2反向传播250
10.3.3神经网络优化中的挑战254
10.3.4神经网络调参方法256
10.4神经网络案例257
10.4.1前馈计算257
10.4.2反向传播计算258
10.5总结260
习题261
本章实验261
第11章深度学习/262
11.1卷积神经网络262
11.1.1卷积及卷积层262
11.1.2汇聚层266
11.1.3几种典型的卷积神经网络268
11.2循环神经网络281
11.2.1基础的循环神经网络281
11.2.2基于门控的循环神经网络286
11.2.3典型应用与实现289
11.3Transformer和大型语言模型297
11.3.1自注意力和Transformer架构297
11.3.2基于Transformer的预训练模型304
11.3.3ChatGPT308
习题313
本章实验314
第12章生成对抗网络/315
12.1算法原理315
12.2数学模型317
12.2.1GAN优化目标317
12.2.2GAN训练算法318
12.2.3分布距离度量319
12.2.4生成器G的全局最优解320
12.2.5GAN优势和劣势321
12.3变体模型322
12.3.1基于Wasserstein距离的生成对抗网络322
12.3.2深度卷积生成对抗网络325
12.4评价标准329
12.4.1IS系列330
12.4.2弗雷切特初始距离331
12.4.3最大均值差异332
12.4.4标准化相对鉴别分数332
12.5GAN实现手写体数字图片生成334
习题342
本章实验342
第4部分强 化 学 习
第13章强化学习/34513.1强化学习概述345
13.1.1基本原理345
13.1.2强化学习和有监督学习345
13.1.3强化学习方法分类346
13.1.4强化学习的发展与应用347
13.2QLearning算法348
13.2.1QLearning算法介绍348
13.2.2QLearning算法实现350
13.2.3QLearning算法实例350
13.2.4QLearning算法评价353
13.3SARSA算法353
13.3.1SARSA算法介绍353
13.3.2SARSA算法原理354
13.3.3SARSA算法实例354
13.3.4SARSA算法评价357
13.4DQN算法358
13.4.1DQN算法介绍358
13.4.2DQN算法原理359
13.4.3DQN算法实例359
13.4.4DQN算法评价362
习题362
本章实验362
|
內容試閱:
|
机器学习是计算机科学和人工智能中非常重要的一个领域,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。本书是一本理工类专业的基础教材,为了让更多的读者能通过本书对机器学习有所实践,本书弱化了机器学习的数学基础知识,同时采用Python语言实现算法。Python代码简单优雅、易于上手,科学计算和机器学习软件包众多,已成为不少大学和研究机构进行教学和研究的语言。相信用Python编写的机器学习代码也能让读者尽快领略到这门学科的精妙之处。
本书作为机器学习领域的基础教材,在内容上尽可能实用且易于上手实践,从机器学习理论到Python实践,对机器学习领域经典方法进行了全面介绍,首先对机器学习进行概述,然后分4部分展开介绍,第1部分介绍监督学习,包括线性模型、决策树分类、贝叶斯分类器、集成学习和支持向量机;第2部分介绍无监督学习,包括关联规则、聚类分析和数据降维;第3部分介绍深度学习,包括神经网络、深度学习和生成对抗网络(GAN);第4部分介绍强化学习。本书所介绍的经典机器学习算法及其应用案例均配有相关实验数据和Python代码实现,通过对应用使用Python语言全过程实现,读者可在不知不觉中加深对经典算法的理解,获得机器学习项目经验,提高编程能力,同时快速领悟看似难懂的机器学习理论。每章末尾均有习题和实验题,便于读者巩固知识和开展课内实验。读者可根据自己的知识储备、兴趣和时间情况选择使用。本书通过经典算法、算法Python实现和实际应用的“三位一体法”,强化对经典算法的理解和掌握,期望读者能对经典算法做到“精”和“通”。
本书第1章由王曙燕编写,第2、6和9章由路龙宾编写,第3、4、5、7、8、12和13章由孙家泽编写,第10章由王红玉编写,第11章由田振洲编写,孙家泽负责全书的校稿工作。感谢西安邮电大学可信软件研究团队的各位同学在稿件的修改和应用的编写中给予的帮助和支持,同时感谢很多领域专家在网络上共享的资源,这些对本书的编写有很大的启发。这里还要特别感谢本书编辑龙启铭,没有龙编辑的帮助,就没有本书的出版。
机器学习的发展日新月异,中国人工智能科技产业发展风起云涌,技术体系包括大数据和云计算、物联网、5G、智能机器人、计算机视觉、自动驾驶、智能芯片、智能推荐、虚拟/增强现实、语音识别、区块链、生物识别、光电技术、自然语言处理、空间技术、人机交互和知识图谱在内的很多类技术,构成了复杂技术体系。罕有人士能对其众多分支领域都精深理解。编者才疏学浅,领域仅略知皮毛,时间和精力所限,书中错误及疏漏之处在所难免,恳请读者批评指正,不胜感激。
编者
2023年1月
|
|