《Python强化学习实战：使用OpenAI Gym、TensorFlow和Keras》 - [美] 托威赫·贝索洛[Taweh，Beysolow II] - 清华大学出版社 - 香港大書城 - Meg Book Store

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

會員書架精選

2023年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書
七月出版：大陸書台灣書
六月出版：大陸書台灣書
五月出版：大陸書台灣書
四月出版：大陸書台灣書
三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書
12月出版：大陸書台灣書
11月出版：大陸書台灣書
十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書

『簡體書』Python强化学习实战：使用OpenAI Gym、TensorFlow和Keras

書城自編碼： 3608853
分類：簡體書→大陸圖書→計算機/網絡→程序設計
作者： [美] 托威赫·贝索洛[Taweh，Beysolow II]
國際書號(ISBN)： 9787302570097
出版社：清华大学出版社
出版日期： 2021-02-01

頁數/字數： /
書度/開本： 16开釘裝：平装

售價：HK$ 82.2

我要買件

** 我創建的書架 **
未登入.

新書推薦：

《清洁》
售價：HK$ 65.0

组队：超级个体时代的协作方式

《组队：超级个体时代的协作方式》
售價：HK$ 77.3

第十三位陪审员

《第十三位陪审员》
售價：HK$ 53.8

微观经济学（第三版）【2024诺贝尔经济学奖获奖者作品】

《微观经济学（第三版）【2024诺贝尔经济学奖获奖者作品】》
售價：HK$ 155.7

Python贝叶斯深度学习

《 Python贝叶斯深度学习》
售價：HK$ 89.4

启微·狂骉年代：西洋赛马在中国

《启微·狂骉年代：西洋赛马在中国》
售價：HK$ 78.4

有趣的中国古建筑

《有趣的中国古建筑》
售價：HK$ 67.0

十一年夏至

《十一年夏至》
售價：HK$ 76.2

編輯推薦：

本书带领读者深入强化宁习算法的世界，并使用Fyth cn在不同用例中应用它们。其中涵盖了一些重要主题，例如策略样度算法和Q学习算法，并使用了TensorFlaw. Keras和OpenAl Gym框架。
本书带领读者深入强化宁习算法的世界，并使用Fyth cn在不同用例中应用它们。其中涵盖了一些重要主题，例如策略样度算法和Q学习算法，并使用了TensorFlaw. Keras和OpenAl Gym框架。
本书介绍了强化学习RL算法背后的理论及用于实现它们的代码。读占将依次学习CpenAl Gym的各类功能，从应用标准库，到创建白己的环境，再到掌掘如何构建龚化学习问题，从而能够研究、开发和部署基千强化学习的解决方案。

內容簡介：

主要内容：使用Python实现强化学习算法；应用A相架，例如OpenAl Gym.TensorFlow和人cras利用云资源部窖并训练基于强化学习的解决方案；实战遢化学习实际应用

關於作者：

Taweh Beysolow II是一位数据科学家和作家，目前居住在美国。他拥有美国圣约翰大学的经济学学士学位和福特汉姆大学的应用统计学理学硕士学位。在成功退出与他人共同创立的初创公司后，他现在担任总部位于旧金山的私人股本公司Industry Capital的董事，在那里领导加密货币和区块链平台。

目錄：

第1章强化学习导论 1
1.1 强化学习的发展史 2
1.2 MDP及其与强化学习的关系 3
1.3 强化学习算法和强化学习框架 5
1.4 Q学习 8
1.5 强化学习的应用 9
1.5.1 经典控制问题 9
1.5.2 《超级马里奥兄弟》游戏 10
1.5.3 《毁灭战士》游戏 11
1.5.4 基于强化学习的做市策略 12
1.5.5 《刺猬索尼克》游戏 12
1.6 本章小结 13
第2章强化学习算法 15
2.1 OpenAI Gym 15
2.2 基于策略的学习 16
2.3 策略梯度的数学解释 17
2.4 基于梯度上升的策略优化 19
2.5 使用普通策略梯度法求解车杆问题 20
2.6 什么是折扣奖励，为什么要使用它们 23
2.7 策略梯度的不足 28
2.8 近端策略优化PPO和Actor-Critic模型 29
2.9 实现PPO并求解《超级马里奥兄弟》 30
2.9.1 《超级马里奥兄弟》概述 30
2.9.2 安装环境软件包 31
2.9.3 资源库中的代码结构 32
2.9.4 模型架构 32
2.10 应对难度更大的强化学习挑战 37
2.11 容器化强化学习实验 39
2.12 实验结果 41
2.13 本章小结 41
第3章强化学习算法：Q学习及其变种 43
3.1 Q学习 43
3.2 时序差分TD学习 45
3.3 epsilon-greedy算法 46
3.4 利用Q学习求解冰湖问题 47
3.5 深度Q学习 50
3.6 利用深度Q学习玩《毁灭战士》游戏 51
3.7 训练与性能 56
3.8 深度Q学习的局限性 57
3.9 双Q学习和双深度Q网络 58
3.10 本章小结 59
第4章基于强化学习的做市策略 61
4.1 什么是做市 61
4.2 Trading Gym 63
4.3 为什么强化学习适用于做市 64
4.4 使用Trading Gym合成订单簿数据 66
4.5 使用Trading Gym生成订单簿数据 67
4.6 实验设计 68
4.6.1 强化学习方法1：策略梯度 71
4.6.2 强化学习方法2：深度Q网络 71
4.7 结果和讨论 73
4.8 本章小结 74
第5章自定义OpenAI强化学习环境 75
5.1 《刺猬索尼克》游戏概述 75
5.2 下载该游戏 76
5.3 编写该环境的代码 78
5.4 A3C Actor-Critic 82
5.5 本章小结 88
附录A 源代码 91

內容試閱：

很荣幸第三次在Apress出版社出书！《Python强化学习实战使用OpenAI Gym、Tensorrflow和Keras》是我撰写过的最复杂书籍，但对于每一位数据科学家和工程师来说都物有所值。在过去的几年中，强化学习领域经历了重大变革，热爱人工智能的每个人都值得全身心投入。
作为人工智能研究的前沿，《Python强化学习实战使用OpenAI Gym、Tensorrflow和Keras》将是熟悉该领域状况以及最常用技术的绝佳起点。基于这一点，我希望读者能够从中汲取力量，从而继续自己的研究并在各自的领域进行创新。

書城介紹　 |　合作申請　|　索要書目　 |　新手入門　|　聯絡方式　 |　幫助中心　|　找書說明　 |　送貨方式　|　付款方式 香港用户　 |　台灣用户　|　大陸用户　|　海外用户

megBook.com.hk

Copyright © 2013 - 2024 （香港）大書城有限公司　 All Rights Reserved.