《机器学习常用算法速查手册》 - 马特哈里森，杜春晓 - Meg Book Store - 香港.大書城

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台( 0 )　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

會員書架精選

2023年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

九月出版：大陸書台灣書
八月出版：大陸書台灣書
七月出版：大陸書台灣書
六月出版：大陸書台灣書
五月出版：大陸書台灣書
四月出版：大陸書台灣書
三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書
12月出版：大陸書台灣書
11月出版：大陸書台灣書
十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書
七月出版：大陸書台灣書

『簡體書』机器学习常用算法速查手册

書城自編碼： 3574193
分類：簡體書→大陸圖書→計算機/網絡→人工智能
作者：马特哈里森，杜春晓
國際書號(ISBN)： 9787519849481
出版社：中国电力出版社
出版日期： 2020-12-01

頁數/字數： /
書度/開本： 16开釘裝：平装

售價：HK$ 116.2

我要買件

** 我創建的書架 **
未登入.

新書推薦：

家书中的百年史

《家书中的百年史》
售價：HK$ 79.4

偏爱月亮

《偏爱月亮》
售價：HK$ 45.8

生物安全与环境

《生物安全与环境》
售價：HK$ 56.4

泥土：文明的侵蚀（城市与生态文明丛书）

《泥土：文明的侵蚀（城市与生态文明丛书）》
售價：HK$ 84.0

医用化学（第三版）

《医用化学（第三版）》
售價：HK$ 57.3

别怕，试一试

《别怕，试一试》
售價：HK$ 67.9

人才基因（凝聚30年人才培育经验与智慧）

《人才基因（凝聚30年人才培育经验与智慧）》
售價：HK$ 103.4

深度学习详解

《深度学习详解》
售價：HK$ 114.8

編輯推薦：

本书以详细的授课笔记、表格和示例，帮助你掌握Python机器学习基础知识，学习建模处理结构化数据。你参加相关培训时，可将这份宝贵的学习指南作为补充材料，你开始下一个机器学习项目时，可将其作为便捷的参考资源。
本书适合程序员、数据科学家和AI工程师，它不仅综述了机器学习的全过程，还带你了解了结构化数据处理的全过程。从本书中，你将学到分类、回归、降维和聚类等多个主题的相关方法。

內容簡介：

本书涵盖以下主题：
用泰坦尼克号数据集讲解分类。
清洗数据和处理缺失数据。
探索数据分析。
数据预处理的常用方法。
选择对模型有用的特征。
模型选择。
度量标准和分类评估。
多种回归分析技术。本书涵盖以下主题：
用泰坦尼克号数据集讲解分类。
清洗数据和处理缺失数据。
探索数据分析。
数据预处理的常用方法。
选择对模型有用的特征。
模型选择。
度量标准和分类评估。
多种回归分析技术。
评估回归结果的度量标准。
聚类算法。
降维技术。
scikit-learn流水线。

關於作者：

Matt Harrison经营着一家叫作MetaSnake的公司，为客户提供Python和数据科学培训和咨询服务。他自2000年起一直使用 Python，期间涉足多个领域：数据科学、BI、存储、自动化测试、开源软件技术栈管理、金融和搜索。

目錄：

目录
前言 1
第1 章机器学习入门 7
本书使用的库 7
用pip 安装库 10
用conda 安装库12
第2 章机器学习流程概览 15
第3 章数据分类工作流：泰坦尼克号数据集 17
项目布局建议 17
导入 18
提出问题 19
数据术语 19
获取数据 21
清洗数据 22
创建特征 29
数据采样 31
数据插值 31
规范数据 32
重构 33
基准模型 35
不同算法族 35
模型堆叠 37
建模 38
评估模型 38
优化模型 40
混淆矩阵 41
ROC 曲线 42
学习曲线 44
部署模型 45
第4 章数据缺失 47
检查数据缺失情况 48
删除缺数据的行或列 52
插值 53
添加标识列 54
第5 章清洗数据 55
处理列名 55
替换缺失值 56
第6 章探索数据 59
数据大小 59
汇总统计 60
直方图 61
散点图 62
Joint Plot 图 63
Pair Grid 图 66
箱形图和小提琴图 68
比较两个序数型特征 69
相关性 71
RadViz 图 76
平行坐标图 78
第7 章预处理数据 81
标准化 81
调整取值范围 83
虚拟变量 84
标签编码 85
频数编码 86
从字符串抽取类别型数据 87
类别型数据的其他编码方法 89
日期特征的处理方法 91
添加col_na 特征 92
特征工程 93
第8 章特征选择 95
共线列 95
套索回归 99
递归特征消除 100
互信息 102
主成分分析 103
特征重要性 103
第9 章类别不平衡 105
采用不同度量标准 105
树模型和集成方法 105
惩罚模型 106
对小众类别上采样 106
生成小众数据 107
对大众类别下采样 107
先上采样，再下采样 109
第10 章分类 111
对数概率回归 112
朴素贝叶斯 117
支持向量机 120
k 近邻 123
决策树 126
随机森林 133
XGBoost 138
LightGBM150
TPOT 155
第11 章模型选择 161
验证曲线 161
学习曲线 163
第12 章度量标准和分类评估 165
混淆矩阵 165
度量标准 168
准确率 170
召回率 171
精准率 171
f1 值 172
分类报告 172
ROC 曲线 173
精准率- 召回率曲线 175
累积增益图 176
lift 曲线 178
类别平衡 180
类别预测错误 181
判别阈值 182
第13 章解释模型 185
回归系数 185
特征重要性 186
LIME 包186
解释树模型 188
部分依赖图 189
替代模型 193
Shapley 值 194
第14 章回归 199
基准模型 201
线性回归 202
支持向量机 206
k 近邻 208
决策树 210
随机森林 217
XGBoost 回归 220
LightGBM 回归 228
第15 章度量标准和回归模型的评估 233
度量标准 233
残差图 236
异方差性 237
残差正态性 237
预测误差图 239
第16 章解释回归模型 241
Shapley 值 241
第17 章降维技术 247
PCA 方法 247
UMAP 方法 267
t-SNE 方法 273
PHATE 方法 277
第18 章聚类 283
k-means 算法 283
层次聚类 290
理解簇 293
第19 章流水线 299
分类流水线 299
回归流水线 302
PCA 流水线 303
作者介绍 305
封面介绍 305

內容試閱：

前言
如今，机器学习和数据科学非常流行，发展迅速。我的绝大部分职业生涯都在与Python 和数据打交道。结构化机器学习问题有一些常用解决方法。我在业内工作用的是这些方法，到工作坊授课讲的还是它们。工作过程，我渴望能找到一本像本书这样的常用机器学习方法参考书。
本书是一本很好的参考资料，汇总了一系列资源和参考示例，用结构化数据建模、预测。Python 有很多库，可解决这类机器学习任务的一部分工作。在本书的写作过程中，我尝试将自己在咨询或业内工作中使用到的实用技术整合进来。
很多读者也许为本书缺少对深度学习技术的介绍而感到惋惜。我之所以没有将其加进来，不仅因为那些技术可自成一书，还因为我喜欢业内认可的更简洁的技术。深度学习技术适用非结构化数据（视频、音频和图像），XGBoost 等强大工具则适用于结构化数据。
我希望本书能成为你解决紧迫问题的有力参考。

書城介紹　 |　合作申請　|　索要書目　 |　新手入門　|　聯絡方式　 |　幫助中心　|　找書說明　 |　送貨方式　|　付款方式 香港用户　 |　台灣用户　|　大陸用户　|　海外用户

megBook.com.hk

Copyright © 2013 - 2024 （香港）大書城有限公司　 All Rights Reserved.