《AI前沿深度强化学习与分布式机器学习套装共2册》 - 刘驰，刘铁岩，等 - 机械工业出版社 - 香港大書城

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

2023年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

『簡體書』AI前沿深度强化学习与分布式机器学习套装共2册

書城自編碼： 3530437
分類：簡體書→大陸圖書→計算機/網絡→人工智能
作者：刘驰，刘铁岩，等
國際書號(ISBN)： 9787X29001789
出版社：机械工业出版社
出版日期： 2020-08-01

頁數/字數： /
書度/開本： 16开釘裝：平装

售價：HK$ 310.2

我要買件

** 我創建的書架 **
未登入.

新書推薦：

《盗墓笔记之秦岭神树4 》
售價：HK$ 57.3

《战胜人格障碍》
售價：HK$ 66.7

《逃不开的科技创新战争》
售價：HK$ 103.3

《漫画三国一百年》
售價：HK$ 55.2

《希腊文明3000年（古希腊的科学精神，成就了现代科学之源）》
售價：HK$ 82.8

《粤行丛录（岭南史料笔记丛刊）》
售價：HK$ 80.2

《岁月待人归：徐悲鸿自述人生艺术》
售價：HK$ 59.8

《女人的中国医疗史：汉唐之间的健康照顾与性别》
售價：HK$ 103.8

編輯推薦：

本套装包含《分布式机器学习：算法、理论与实践》和《深度强化学习：学术前沿与实战应用》各1本
适读人群：既可作为研究生从事分布式机器学习方向研究的参考文献，也可以作为人工智能从业者进行算法选择和系统设计的工具书。
《分布式机器学习：算法、理论与实践》
全面展示分布式机器学习理论、方法与实践
微软亚洲研究院机器学习核心团队潜心力作
鄂维南院士、周志华教授倾心撰写推荐序
内容前沿全面，讨论系统深刻，全彩印刷
《深度强化学习：学术前沿与实战应用》
1.作者资深。本书由北京理工大学刘驰教授团队撰写；
2.直奔主题，理论结合实践。详解单智能体、多智能体深度强化学习和分布式、多任务深度强化学习相关算法，深入解读每种算法的代码原型实现；
3.领域应用分析：给出深度强化学习在游戏、机器人控制、计算机视觉和自然语言处理四大领域的实际应用，侧重讨论深度强化学习在不同领域应用的思想和方法；
4. 前沿经典综述：详述近五年深度强化学习领域的重要进展，涵盖新的算法理论、工程实现和领域应用，从基础到算法，再到典型应用场景。

內容簡介：

《分布式机器学习：算法、理论与实践》
人工智能和大数据时代，解决*有挑战性问题的主流方案是分布式机器学习！《分布式机器学习：算法、理论与实践》旨在全面介绍分布式机器学习的现状，深入分析其中的核心技术问题，并且讨论该领域未来的发展方向。
由微软亚洲研究院机器学习核心团队潜心力作！鄂维南院士、周志华教授倾心撰写推荐序！
本书旨在全面介绍分布式机器学习的现状，深入分析其中的核心技术问题，并且讨论该领域未来的发展方向。
全书共12章。第1章是绪论，向大家展示分布式机器学习这个领域的全景。第2章介绍机器学习的基础知识。第3章到第8章是本书的核心部分，向大家细致地讲解分布式机器学习的框架及其各个功能模块。其中第3章给出整个分布式机器学习框架的综述，而第4章到第8章则分别针对其中的数据与模型划分模块、单机优化模块、通信模块、数据与模型聚合模块加以介绍。接下来的三章是对前面内容的总结与升华。其中第9章介绍由分布式机器学习框架中不同选项所组合出来的各式各样的分布式机器学习算法，第10章讨论这些算法的理论性质，第11章则介绍几个主流的分布式机器学习系统（包括Spark MLlib 迭代式MapReduce系统，Multiverso参数服务器系统，TensorFlow数据流系统）。*后的第12章是全书的结语，在对全书内容进行简要总结之后，着重讨论分布式机器学习这个领域未来的发展方向。
本书基于微软亚洲研究院机器学习研究团队多年的研究成果和实践经验写成，既可以作为研究生从事分布式机器学习方向研究的参考文献，也可以作为人工智能从业者进行算法选择和系统设计的工具书。
人工智能大潮中，市场上已有许多机器学习书籍，但是分布式机器学习的专门书籍还很少见。本书是希望学习和了解分布式机器学习的读者的福音。

《深度强化学习：学术前沿与实战应用》
本书共分为四篇，即深度强化学习、多智能体深度强化学习、多任务深度强化学习和深度强化学习的应用。由浅入深、通俗易懂，涵盖经典算法和近几年的前沿技术进展。特别是书中详细介绍了每一种代表性算法的代码原型实现，旨在理论与实践相结合，让读者学有所得、学有所用。
*篇（包含第1～3章）主要讲解深度强化学习基础，侧重于单智能体强化学习算法，相对简单，有助于初级读者理解，同时涵盖了近几年的经典算法和一些前沿的研究成果。
第二篇（包含第4～5章）主要侧重于对多智能体深度强化学习的讲解，从多智能体强化学习基本概念到相关算法的讲解和分析，以多个极具代表性的算法为例带领读者逐步学习多智能体训练及控制的理论与方法。同时，还介绍了多智能体强化学习领域一些前沿学术成果。
第三篇（包含第6～7章）扩展到多任务场景，称为多任务深度强化学习。首先介绍了多任务强化学习的基本概念和相关基础知识，随后讲解了部分经典的多任务深度强化学习算法。
第四篇（包含第8～11章）主要讲解深度强化学习的实际应用，涉及游戏、机器人控制、计算机视觉和自然语言处理四大领域。通过领域应用中思想和方法的讲解，培养读者跨领域解决实际问题的能力，以帮助读者熟练掌握和使用深度强化学习这一强大的方法来解决和优化实际工程领域中的问题。

關於作者：

《分布式机器学习：算法、理论与实践》《分布式机器学习：算法、理论与实践》
刘铁岩，微软亚洲研究院副院长。刘博士的先锋性研究促进了机器学习与信息检索之间的融合，被国际学术界公认为排序学习领域的代表人物。近年来在深度学习、分布式学习、强化学习等方面也颇有建树，发表论文200余篇，被引用近两万次。多次获得最佳论文奖、引用论文奖、Springer十大畅销华人作者、Elsevier 高引中国学者等。被聘为卡内基-梅隆大学（CMU）客座教授，诺丁汉大学荣誉教授，中国科技大学教授、博士生导师；被评为国际电子电气工程师学会（IEEE）会士，国际计算机学会（ACM）杰出会员。

陈薇，微软亚洲研究院机器学习组主管研究员，研究机器学习各个分支的理论解释和算法改进，尤其关注深度学习、分布式机器学习、强化学习、博弈机器学习、排序学习等。2011年于中国科学院数学与系统科学研究院获得博士学位，同年加入微软亚洲研究院，负责机器学习理论项目，先后在NIPS、ICML、AAAI、IJCAI等相关领域顶会和期刊上发表文章30余篇。

王太峰，蚂蚁金服人工智能部总监、资深算法专家。在蚂蚁金服负责AI算法组件建设，算法工作服务于蚂蚁金服的支付、国际、保险等多条业务线。在加入蚂蚁之前在微软亚洲研究院工作11年，任主管研究员，他的研究方向包括大规模机器学习、数据挖掘、计算广告学等。在国际顶会上发表近20篇的论文，在大规模机器学习工具开源方面也做出过很多贡献，在微软期间主持开发过DMTK的开源项目。

高飞，微软亚洲研究院副研究员，主要从事分布式机器学习和深度学习的研究工作，并在国际会议上发表多篇论文。2014年设计开发了当时规模最大的主题模型算法和系统LightLDA。他还开发了一系列分布式机器学习系统，并通过微软分布式机器学习工具包（DMTK）开源在GitHub上。

《深度强化学习：学术前沿与实战应用》
刘驰
北京理工大学计算机学院副院长、教授、博士生导师，英国工程技术学会会士（IET Fellow），IEEE高级会员（IEEE Senior Member），英国计算机学会会士（Fellow of British Computer Society）和英国皇家艺术学会会士（Fellow of Royal Society of Arts）。分别于清华大学和英国帝国理工学院获得学士和博士学位，曾任美国IBM T.J. Watson研究中心和IBM中国研究院研究主管，并在德国电信研究总院（柏林）任博士后研究员。研究方向为大数据与物联网技术。主持了国家自然科学基金、国家重点研发计划课题、工信部、教育部、装发预研等20余省部级研究项目。共发表SCIEI论文百余篇，其中ESI高被引论文2篇、CCF- A类论文20余篇，授权国内外发明专利14项，编写书籍9本，Google Scholar索引3500余次，H index为28。现任国家自然科学基金会评专家、科技部重点研发计划会评专家、教育部科技奖评审专家、全国信标委技术委员会委员、中国电子学会理事、中国计算机学会青工委委员、中国计算机学会物联网大数据普适计算专委会委员、中国电子学会物联网专委会委员副秘书长、中国自动化学会大数据专委会委员、中国通信学会物联网专委会委员等；以及IEEE Transactions on Network Science and Engineering编委、IEEE ICC 2020 Symposium Chair for Next Generation Networking。入选了国家人社部高层次留学人才回国资助计划、中国科协青年人才托举工程、陕西省第八批百人计划（短期项目）、中国产学研合作促进奖、中国电子学会优秀科技工作者、国家十二五轻工业科技创新先进个人、2017年中国物联网年度人物等。并获得省部级一等奖1项、二等奖1项、三等奖1项。

序言一
序言二
前言
作者介绍
第1章绪论 1
1.1 人工智能及其飞速发展 2
1.2 大规模、分布式机器学习 4
1.3 本书的安排 6
参考文献 7
第2章机器学习基础 9
2.1 机器学习的基本概念 10
2.2 机器学习的基本流程 13
2.3 常用的损失函数 16
2.3.1 Hinge损失函数 16
2.3.2 指数损失函数 16
2.3.3 交叉熵损失函数 17
2.4 常用的机器学习模型 18
2.4.1 线性模型 18
2.4.2 核方法与支持向量机 18
2.4.3 决策树与Boosting 21
2.4.4 神经网络 23
2.5 常用的优化方法 32
2.6 机器学习理论 33
2.6.1 机器学习算法的泛化误差 34
2.6.2 泛化误差的分解 34
2.6.3 基于容度的估计误差的上界 35
2.7 总结 36
参考文献 36
第3章分布式机器学习框架 41
3.1 大数据与大模型的挑战 42
3.2 分布式机器学习的基本流程 44
3.3 数据与模型划分模块 46
3.4 单机优化模块 48
3.5 通信模块 48
3.5.1 通信的内容 48
3.5.2 通信的拓扑结构 49
3.5.3 通信的步调 51
3.5.4 通信的频率 52
3.6 数据与模型聚合模块 53
3.7 分布式机器学习理论 54
3.8 分布式机器学习系统 55
3.9 总结 56
参考文献 57
第4章单机优化之确定性算法 61
4.1 基本概述 62
4.1.1 机器学习的优化框架 62
4.1.2 优化算法的分类和发展历史 65
4.2 一阶确定性算法 67
4.2.1 梯度下降法 67
4.2.2 投影次梯度下降法 69
4.2.3 近端梯度下降法 70
4.2.4 Frank-Wolfe算法 71
4.2.5 Nesterov加速法 72
4.2.6 坐标下降法 75
4.3 二阶确定性算法 75
4.3.1 牛顿法 76
4.3.2 拟牛顿法 77
4.4 对偶方法 78
4.5 总结 81
参考文献 8
第5章单机优化之随机算法 85
5.1 基本随机优化算法 86
5.1.1 随机梯度下降法 86
5.1.2 随机坐标下降法 88
5.1.3 随机拟牛顿法 91
5.1.4 随机对偶坐标上升法 93
5.1.5 小结 95
5.2 随机优化算法的改进 96
5.2.1 方差缩减方法 96
5.2.2 算法组合方法 100
5.3 非凸随机优化算法 101
5.3.1 Ada系列算法 102
5.3.2 非凸理论分析 104
5.3.3 逃离鞍点问题 106
5.3.4 等级优化算法 107
5.4 总结 109
参考文献 109
第6章数据与模型并行 113
6.1 基本概述 114
6.2 计算并行模式 117
6.3 数据并行模式 119
6.3.1 数据样本划分 120
6.3.2 数据维度划分 123
6.4 模型并行模式 123
6.4.1 线性模型 123
6.4.2 神经网络 127
6.5 总结 133
参考文献 133
第7章通信机制 135
7.1 基本概述 136
7.2 通信的内容 137
7.2.1 参数或参数的更新 137
7.2.2 计算的中间结果 137
7.2.3 讨论 138
7.3 通信的拓扑结构 139
7.3.1 基于迭代式MapReduceAllReduce的通信拓扑 140
7.3.2 基于参数服务器的通信拓扑 142
7.3.3 基于数据流的通信拓扑 143
7.3.4 讨论 145
7.4 通信的步调 145
7.4.1 同步通信 146
7.4.2 异步通信 147
7.4.3 同步和异步的平衡 148
7.4.4 讨论 150
7.5 通信的频率 150
7.5.1 时域滤波 150
7.5.2 空域滤波 153
7.5.3 讨论 155
7.6 总结 156
参考文献 156
第8章数据与模型聚合 159
8.1 基本概述 160
8.2 基于模型加和的聚合方法 160
8.2.1 基于全部模型加和的聚合 160
8.2.2 基于部分模型加和的聚合 162
8.3 基于模型集成的聚合方法 167
8.3.1 基于输出加和的聚合 168
8.3.2 基于投票的聚合 171
8.4 总结 174
参考文献 174
第9章分布式机器学习算法 177
9.1 基本概述 178
9.2 同步算法 179
9.2.1 同步SGD方法 179
9.2.2 模型平均方法及其改进 182
9.2.3 ADMM算法 183
9.2.4 弹性平均SGD算法 185
9.2.5 讨论 186
9.3 异步算法 187
9.3.1 异步SGD 187
9.3.2 Hogwild!算法 189
9.3.3 Cyclades算法 190
9.3.4 带延迟处理的异步算法 192
9.3.5 异步方法的进一步加速 199
9.3.6 讨论 199
9.4 同步和异步的对比与融合 199
9.4.1 同步和异步算法的实验对比 199
9.4.2 同步和异步的融合 201
9.5 模型并行算法 203
9.5.1 DistBelief 203
9.5.2 AlexNet 204
9.6 总结 205
参考文献 205
第10章分布式机器学习理论 209
10.1 基本概述 210
10.2 收敛性分析 210
10.2.1 优化目标和算法 211
10.2.2 数据和模型并行 213
10.2.3 同步和异步 215
10.3 加速比分析 217
10.3.1 从收敛速率到加速比 218
10.3.2 通信量的下界 219
10.4 泛化分析 221
10.4.1 优化的局限性 222
10.4.2 具有更好泛化能力的非凸优化算法 224
10.5 总结 226
参考文献 226
第11章分布式机器学习系统 229
11.1 基本概述 230
11.2 基于IMR的分布式机器学习系统 231
11.2.1 IMR和Spark 231
11.2.2 Spark MLlib 234
11.3 基于参数服务器的分布式机器学习系统 236
11.3.1 参数服务器 236
11.3.2 Multiverso参数服务器 237
11.4 基于数据流的分布式机器学习系统 241
11.4.1 数据流 241
11.4.2 TensorFlow数据流系统 243
11.5 实战比较 248
11.6 总结 252
参考文献 252
第12章结语 255
12.1 全书总结 256
12.2 未来展望 257
索引 260

內容試閱：

《分布式机器学习：算法、理论与实践》
近年来，人工智能取得了飞速的发展，实现了一个又一个技术突破。这些成功的幕后英雄是海量的训练数据、超大规模的机器学习模型以及分布式的训练系统。一系列有关分布式机器学习的研究工作，从并行模式、跨机通信到聚合机制，从算法设计、理论推导到系统构建，都在如火如荼地展开。人们不仅发表了大量的学术论文，也开发出一批实用性很强的分布式机器学习系统。本书的目的是向读者全面展示分布式机器学习的现状，深入分析其中的核心技术问题，并且讨论该领域未来发展的方向。本书既可以作为研究生从事分布式机器学习方向研究的参考文献，也可以作为人工智能从业者进行算法选择和系统设计的工具书。
全书共12章。第1章是绪论，向大家展示分布式机器学习这个领域的全景。第2章介绍机器学习的基础知识，其中涉及的基本概念、模型和理论，会为读者在后续章节中更好地理解分布式机器学习的各项技术奠定基础。第3章到第8章是本书的核心部分，向大家细致地讲解分布式机器学习的框架及其各个功能模块。其中第3章对整个分布式机器学习框架做综述，而第4章到第8章则针对其中的数据与模型划分模块、单机优化模块、通信模块、数据与模型聚合模块分别加以介绍，展示每个模块的不同选项并讨论其长处与短板。接下来的三章是对前面内容的总结与升华。其中第9章介绍由分布式机器学习框架中不同选项所组合出来的各式各样的分布式机器学习算法，第10章讨论这些算法的理论性质（例如收敛性），第11章则介绍几个主流的分布式机器学习系统（包括Spark MLlib、Multiverso参数服务器系统和TensorFlow数据流系统）。最后的第12章是全书的结语，在对全书内容进行简要总结之后，着重讨论分布式机器学习这个领域未来的发展方向。
有关本书的写作，因为涉及分布式机器学习的不同侧面，不同的章节对读者预备知识的要求有所不同。尤其是涉及优化算法和学习理论的部分，要求读者对于最优化理论和概率统计有一定的知识储备。不过，如果读者的目的只是熟悉主流的分布式机器学习框架和系统，则可以跳过这些相对艰深的章节，因为其余章节自成体系，对于理论部分没有过多的依赖。
我仍然清晰地记得，两年以前华章公司的姚蕾编辑多次找到我，希望我能撰写一本关于分布式机器学习的图书。一方面被姚蕾的诚意打动，另一方面也考虑到这样一本书对于在校研究生和人工智能从业者可能有所帮助，我最终欣然应允。然而，平时工作过于繁忙，真正可以用来写书的时间非常有限，所以一晃就是两年的时光，直至今日本书才与读者见面，内心十分惭愧。
回顾这两年的写作过程，有很多人需要感谢。首先，我要感谢本书的联合作者：陈薇博士负责书中与优化算法和学习理论有关的内容，王太峰和高飞则主要负责通信机制、聚合模式和分布式机器学习系统等方面的内容。没有他们夜以继日的努力，本书无法成文。在写作过程中，本书的各位作者得到了家人的大力支持。写书之路实属不易，如果没有她（他）们的默默奉献，作者们很难集中精力，攻克这个艰巨的任务。其次，我要感谢诸多为本书的写作做出过重要贡献的人：我在中国科学技术大学的博士生郑书新花费了大量的精力和时间帮助我们整理了全书的参考文献；北京大学的孟琪同学则帮助我们对全书做了细致的校验；华章公司的编辑姚蕾和迟振春对我们的书稿提出了很多宝贵的意见；普林斯顿大学教授、中国科学院院士鄂维南博士，以及南京大学教授周志华博士分别为本书题写了推荐序。正是因为这么多幕后英雄的奉献，本书才得以顺利面世。最后，我还要感谢微软亚洲研究院院长洪小文博士，他的大力支持使得我们在分布式机器学习这个领域做出了很多高质量的研究工作，也使得我们有机会把这些成果记录下来，编纂成书，与更多的同行分享。
惭愧的是，即便耗时两载，即便集合了多人的智慧和努力，本书的写作仍然略显仓促。加之分布式机器学习这个领域飞速发展，本书成稿之时，又有很多新的研究成果发表，难以周全覆盖。再则，本书的作者才疏学浅，书中难免有疏漏、错误之处，还望读者海涵，不吝告知，日后加以勘误，不胜感激。
刘铁岩
于北京中关村
2018年6月

《深度强化学习：学术前沿与实战应用》
随着计算设备算力的不断提升和可用数据量的持续积累，基于大数据的机器学习（Machine Learning）方法近年来得到了空前的发展，且可以预见在一段时间内还将继续飞速发展。机器学习的突出成就离不开深度学习（Deep Learning）。深度神经网络的出现，使得原始图像、视频和自然语言等数据源可作为输入和输出，从而为诸多复杂问题提供了强大的解决方案。基于深度学习的人工智能产品也正在快速渗入和改变着我们的日常生活，如人脸识别、购物网站的个性化推荐、无人驾驶等。此外，机器翻译、自主决策、目标跟踪及一系列技术成果也在医疗、教育和网络安全等重要领域得到了实质性的应用。
强化学习（Reinforcement Learning），又称再励学习、评价学习，是机器学习的一个重要分支，传统上主要用于解决与环境交互过程中的自主决策和自动控制问题，通过不断改善智能体自身的行为，学得最优的行动策略。广义上说，任何有决策的任务都可以使用强化学习方法，比如无人驾驶、机器人控制、游戏竞技等，但也不限于此，比如个性化推荐算法、网络传输等非控制领域也可以使用强化学习方法。近年来，最著名的强化学习应用当属AlphaGo围棋，其学得的策略所表现出的控制决策能力已经达到甚至超过了人类顶级水平，其中使用了深度强化学习（Deep Reinforcement Learning）。深度强化学习是强化学习的重要发展，是指采用深度神经网络作为模型的强化学习方法。它的起源很早，但著名的案例是Google DeepMind在2013年NIPS研讨会上发表的DQN（Deep Q Network）方法，该方法在多款Atari游戏中取得了不俗的表现。之后，深度强化学习的发展便一发不可收拾，学术界和工业界均大力推动其发展。本书重点讲解深度强化学习近年来的重要进展及其典型应用场景。
本书共分为四篇，即深度强化学习、多智能体深度强化学习、多任务深度强化学习和深度强化学习的应用，内容由浅入深、通俗易懂，涵盖近几年最经典、最前沿的技术进展。特别是书中详细介绍了每一种算法的代码原型实现，做到了理论与实践相结合，让读者学有所得、学有所用。
第一篇主要讲解深度强化学习基础，侧重于单智能体强化学习算法，相对简单，有助于初级读者理解。本篇包含第1～3章，从基础到算法，分类清晰。
l 第1章主要讲解强化学习的发展历史、基本概念及一些相关的基础知识，以帮助读者对强化学习有一个全面的了解和认知，也为本书后面的重点章节提供基础性的知识铺垫。
l 第2章侧重于讲解基于单智能体的深度强化学习算法，涵盖了DQN、DDPG、Rainbow等典型算法，以及最新的研究成果，如基于模型、基于分层的深度强化学习算法等。
l 第3章提供了一些分布式深度强化学习方法，以适应分布式计算的情况，有助于缩短模型的训练时间和进行大规模任务的计算。
第二篇主要侧重于对多智能体深度强化学习的讲解，承接上一篇的单智能体环境，本篇将问题复杂化，扩大到多智能体的情况。本篇包含第4章和第5章，从多智能体强化学习基本概念到相关算法的讲解、分析，以多个极具代表性的算法为例带领读者逐步学习多智能体训练和控制的理论与方法。此外，还为读者提供了当下多智能体强化学习领域最前沿的一些学术成果，紧跟发展潮流。
l 第4章主要讲解多智能体的基本概念及相关的背景知识，以帮助读者更好地进入多智能体世界。
l 第5章按类别讲解大量多智能体强化学习算法，从基于值函数的算法到基于策略的算法，再到基于AC框架的算法，应有尽有。本章囊括了当下大部分经典和前沿研究，让读者在掌握经典知识的同时也能够把握最新的发展方向。
第三篇再一次将问题复杂化，扩大到多任务的情况，也称为多任务深度强化学习。与多智能体强化学习明显不同，多任务强化学习既可以是单智能体多任务的情况，也可以是多智能体多任务的情况，因此情况变得更为复杂了。结构如同第二篇，本篇依然是首先介绍多任务强化学习的基本概念和相关基础知识（第6章），随后讲解部分经典的多任务强化学习算法（第7章）。由于多任务强化学习依然是较为前沿的研究方向，所以本篇的算法相对少一些。
l 第6章主要介绍多任务强化学习的基本概念和相关知识，让读者对其有一个详细的了解和认知，以帮助读者顺利地步入多任务深度强化学习场景。
l 第7章主要讲解4个多任务强化学习算法、框架，这些方法大都源自DeepMind团队，代表着多任务强化学习领域最为经典和前沿的工作。
第四篇包括第8～11章，主要讲解强化学习特别是深度强化学习的一些实际应用，涉及游戏、机器人控制、计算机视觉和自然语言处理四大领域。本篇侧重于讲解深度强化学习方法在其他领域应用的思想和方法，培养读者跨领域解决问题的能力，以帮助读者熟练掌握和使用深度强化学习这个强大的方法去解决、优化其他领域中的一些实际问题。
l 第8章给出深度强化学习方法在游戏领域的应用，这也是一个极有意思的领域，例如，DQN的代表作就是玩Atari游戏，并且超越了人类顶级玩家。本章重点讲解如何把游戏场景建模为强化学习问题，以及训练模型自动玩Atari游戏的核心过程和相关代码。
l 第9章主要给出深度强化学习算法在机器人控制领域的应用实例，包括无地图导航、视觉导航、机器人足球等，侧重于讲解仿真环境中机器人控制问题的分析、建模和实践性解决方案。
l 第10章给出强化学习与计算机视觉领域相结合的例子，分析了将深度强化学习技术应用于图像、视频的详细过程，例如，图像字幕、图像恢复、视频快进和视觉跟踪等。
l 第11章则讲解深度强化学习应用于自然语言处理方面的实例，如对话机器人、情感情感翻译和远程监督关系提取等。深度强化学习与自然语言的结合目前还是较为前沿的研究方向，还有许多领域相关问题读者也可以亲自尝试着去解决。
本书的编撰人员包括：刘驰、王占健、戴子彭、马晓鑫、朴成哲、林秋霞、赵一诺、赵映、李世林、刘文鼎。
深度强化学习技术发展迅速，属于当下最热门的前沿技术之一。因作者能力、水平有限，书中难免出现不足与谬误之处，还请读者多多包涵，同时也恳请读者给予批评指正，不胜感激。

書城介紹　 \|　合作申請　\|　索要書目　 \|　新手入門　\|　聯絡方式　 \|　幫助中心　\|　找書說明　 \|　送貨方式　\|　付款方式	香港用户　 \|　台灣用户　\|　大陸用户　\|　海外用户

	megBook.com.hk
Copyright © 2013 - 2024 （香港）大書城有限公司　 All Rights Reserved.