《Spark Cookbook 中文版》 - [印度]Rishi Yadav[亚达夫] - 人民邮电出版社 - 香港大書城 - Meg Book Store

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

會員書架精選

2023年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書
七月出版：大陸書台灣書
六月出版：大陸書台灣書
五月出版：大陸書台灣書
四月出版：大陸書台灣書
三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書
12月出版：大陸書台灣書
11月出版：大陸書台灣書
十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書

『簡體書』Spark Cookbook 中文版

書城自編碼： 2902855
分類：簡體書→大陸圖書→計算機/網絡→行业软件及应用
作者： [印度]Rishi Yadav[亚达夫]
國際書號(ISBN)： 9787115429667
出版社：人民邮电出版社
出版日期： 2016-10-01
版次： 1 印次： 1
頁數/字數： 190/
書度/開本： 16开釘裝：平装

售價：HK$ 67.5

我要買件

** 我創建的書架 **
未登入.

新書推薦：

万千教育学前·与幼儿一起解决问题：捕捉幼儿园一日生活中的教育契机

《万千教育学前·与幼儿一起解决问题：捕捉幼儿园一日生活中的教育契机》
售價：HK$ 47.0

爱你，是我做过最好的事

《爱你，是我做过最好的事》
售價：HK$ 55.8

史铁生：听风八百遍，才知是人间（2）

《史铁生：听风八百遍，才知是人间（2）》
售價：HK$ 55.8

量子网络的构建与应用

《量子网络的构建与应用》
售價：HK$ 109.8

拍电影的热知识：126部影片里的创作技巧（全彩插图版）

《拍电影的热知识：126部影片里的创作技巧（全彩插图版）》
售價：HK$ 109.8

大唐名城：长安风华冠天下

《大唐名城：长安风华冠天下》
售價：HK$ 87.4

情绪传染（当代西方社会心理学名著译丛）

《情绪传染（当代西方社会心理学名著译丛）》
售價：HK$ 88.5

中国年画 1950-1990 THE NEW CHINA: NEW YEAR PICTURE 英文版

《中国年画 1950-1990 THE NEW CHINA: NEW YEAR PICTURE 英文版》
售價：HK$ 236.0

建議一齊購買：

+

HK$ 85.6
《Python机器学习经典实例》

+

HK$ 214.6
《Hadoop权威指南：大数据的存储与分析（第4版）》

+

HK$ 94.3
《Spark：大数据集群计算的生产实践》

+

HK$ 114.6
《TensorFlow技术解析与实战》

+

HK$ 100.1
《面向机器智能的TensorFlow实践》

+

HK$ 56.6
《Spark Streaming：实时流处理入门与精通》

內容簡介：

Spark是一个基于内存计算的开源集群计算系统，它非常小巧玲珑，让数据分析更加快速，已逐渐成为新一代大数据处理平台中的佼佼者。
本书内容分为12章，从认识Apache Spark开始讲解，陆续介绍了Spark的使用、外部数据源、Spark SQL、Spark Streaming、机器学习、监督学习中的回归和分类、无监督学习、推荐系统、图像处理、优化及调优等内容。
本书适合大数据领域的技术人员，可以帮助他们更好地洞悉大数据，本书也适合想要学习Spark进行大数据处理的人员，它将是一本绝佳的参考教程。

關於作者：

Rishi Yadav拥有17年设计和开发企业级应用的经验。他是一位开源软件专家，引领了美国公司的大数据趋势。Rish被评为2014年40位40岁以下硅谷杰出工程师之一。他于1998年获得杰出的印度理工学院（Indian Institute of Technology，IIT）德里分校的学士学位。大约在10年前，Rishi创办了InfoObjects，这是一家以深度探索数据为宗旨的企业。该公司已连续4年被列入发展快公司5000强。InfoObjects也被授予了2014及2015年度湾区杰出工作地点首名的桂冠。Rishi还是一位开源社区贡献者和活跃的博主。

目錄：

目录
第1章　开始使用Apache Spark1
1.1　简介　1
1.2　使用二进制文件安装Spark　2
1.3　通过Maven构建Spark源码　5
1.4　在Amazon EC2上部署Spark　7
1.5　在集群上以独立模式部署
Spark　13
1.6　在集群上使用Mesos部署Spark　18
1.7　在集群上使用YARN部署　19
1.8　使用Tachyon作为堆外存储层　22
第2章　使用Spark开发应用　27
2.1　简介　27
2.2　探索Spark shell　27
2.3　在Eclipse中使用Maven开发Spark应用　29
2.4　在Eclipse中使用SBT开发Spark应用　33
2.5　在Intellij IDEA中使用Maven开发Spark应用　34
2.6　在Intellij IDEA中使用SBT开发Spark应用　36
第3章　外部数据源　38
3.1　简介　38
3.2　从本地文件系统加载数据　39
3.3　从HDFS加载数据　40
3.4　从HDFS加载自定义输入格式的数据　45
3.5　从Amazon S3加载数据　46
3.6　从Apache Cassandra加载数据　49
3.7　从关系型数据库加载数据　54
第4章　Spark SQL　57
4.1　简介　57
4.2　理解Catalyst优化器　60
4.3　创建HiveContext　63
4.4　使用case类生成数据格式　66
4.5　编程指定数据格式　67
4.6　使用Parquet格式载入及存储数据　69
4.7　使用JSON格式载入及存储数据　73
4.8　从关系型数据库载入及存储数据　75
4.9　从任意数据源载入及存储数据　78
第5章　Spark Streaming　80
5.1　简介　80
5.2　使用Streaming统计字数　82
5.3　Twitter流数据处理　84
5.4　Kafka流数据处理　88
第6章　机器学习——MLlib　94
6.1　简介　94
6.2　创建向量　95
6.3　创建向量标签　97
6.4　创建矩阵　99
6.5　计算概述统计量　101
6.6　计算相关性　102
6.7　进行假设检验　104
6.8　使用ML创建机器学习
流水线　106
第7章　监督学习之回归——MLlib　109
7.1　简介　109
7.2　使用线性回归　110
7.3　理解代价函数　112
7.4　使用Lasso线性回归　116
7.5　使用岭回归　117
第8章　监督学习之分类——MLlib　119
8.1　简介　119
8.2　逻辑回归分类　119
8.3　支持向量机二元分类　124
8.4　决策树分类　127
8.5　随机森林分类　134
8.6　梯度提升树（GBTs）分类　139
8.7　朴素贝叶斯分类　140
第9章　无监督学习——MLlib　143
9.1　简介　143
9.2　使用k-means聚类　144
9.3　主成分分析的降维　149
9.4　奇异值分解降维　155
第10章　推荐系统　159
10.1　简介　159
10.2　显性反馈的协同过滤　161
10.3　隐性反馈的协同过滤　164
第11章　图像处理——GraphX　169
11.1　简介　169
11.2　基本图像运算　170
11.3　使用PageRank　171
11.4　查找连通分量　174
11.5　相邻聚合实现　177
第12章　优化及调优　180
12.1　简介　180
12.2　内存优化　183
12.3　使用压缩提升性能　185
12.4　使用序列化提升性能　186
12.5　优化垃圾回收　187
12.6　优化并行度的级别　187
12.7　理解未来的优化——Tungsten
项目　188

書城介紹　 |　合作申請　|　索要書目　 |　新手入門　|　聯絡方式　 |　幫助中心　|　找書說明　 |　送貨方式　|　付款方式 香港用户　 |　台灣用户　|　大陸用户　|　海外用户

megBook.com.hk

Copyright © 2013 - 2024 （香港）大書城有限公司　 All Rights Reserved.