登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書

『簡體書』Hadoop理论与实践

書城自編碼: 3575898
分類:簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 北京百里半网络技术有限公司,李平
國際書號(ISBN): 9787302559504
出版社: 清华大学出版社
出版日期: 2021-01-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 72.5

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
权力制衡:罗马宪法对近代西欧宪制的影响
《 权力制衡:罗马宪法对近代西欧宪制的影响 》

售價:HK$ 89.7
间谍大师:情报、技术与以色列商业创新
《 间谍大师:情报、技术与以色列商业创新 》

售價:HK$ 90.9
浪荡子美学与跨文化现代性:一九三零年代上海、东京及巴黎的浪荡子、漫游者与译者
《 浪荡子美学与跨文化现代性:一九三零年代上海、东京及巴黎的浪荡子、漫游者与译者 》

售價:HK$ 78.2
孤独与相遇的社会学
《 孤独与相遇的社会学 》

售價:HK$ 59.8
精微植物艺术表现技法大全
《 精微植物艺术表现技法大全 》

售價:HK$ 227.7
坦克行动:一名装甲部队指挥官的战争(1944年至1945年)
《 坦克行动:一名装甲部队指挥官的战争(1944年至1945年) 》

售價:HK$ 114.8
翻译的危险:清代中国与大英帝国之间两位译者的非凡人生
《 翻译的危险:清代中国与大英帝国之间两位译者的非凡人生 》

售價:HK$ 94.3
论法拉比与迈蒙尼德:施特劳斯讲演与论文集:卷三
《 论法拉比与迈蒙尼德:施特劳斯讲演与论文集:卷三 》

售價:HK$ 109.3

 

編輯推薦:
《Hadoop理论与实践》对 Hadoop 的架构、原理和生态系统组成进行了详细的解读,结构清晰,对于需要详细了解和应用 Hadoop 的读者是一个不错的选择。
《Hadoop理论与实践》是北京百里半网络技术有限公司所编著的大数据人工智能系列丛书中的一本,它为该系列的其他几本专业教材提供了大数据入门的支撑。
《Hadoop理论与实践》凝聚了编委会多年来的教学经验和成果,内容安排合理,层次清晰,通俗易懂,实例丰富,突出理论和实践相结合,可作为各类高等院校教材,也可供广大程序设计人员参考。
內容簡介:
《Hadoop理论与实践》按照高等学校大数据、人工智能课程基本要求,以案例驱动的形式来组织内容,突出该课程的实践性特点。《Hadoop理论与实践》主要包含四大部分:Hadoop技术、数据仓库与Hive、Flume分布式日志处理系统、Spark及其生态圈概述。其中,Hadoop技术包括大数据与数据分析、Hadoop生态系统介绍、Hadoop存储、Hadoop计算之MapReduce、Hadoop安全等;数据仓库与Hive包括Hive与数据库的基础知识、Hive的高级特性、Hive优化及案例的应用;Flume分布式日志处理系统包括Flume介绍、Flume使用案例及Flume开发案例的应用;Spark及其生态圈概述包括Spark简介及Spark生态系统详解。 《Hadoop理论与实践》内容安排合理,层次清晰,通俗易懂,实例丰富,突出理论与实践的结合,可作为各类高等院校人工智能与大数据相关专业的教材,也可供广大程序设计人员参考。
關於作者:
北京百里半网络技术有限公司
北京百里半网络技术有限公司为武汉厚溥企业集团成员单位,致力于互联网相关信息技术产品和服务的研究与开发,以及在线教育行业产品、服务的集成运营。公司拥有雄厚的具备学术、教育及产业背景的研发团队。
公司为政府、高校、企业等提供极具竞争力的产品服务。在人工智能、大数据及IT运维、互联网用户行为分析、在线教育等领域推出了自有知识产权的独特而领先的产品,为公司的持续发展奠定了坚实的基础。
北京百里半网络技术有限公司长期以来坚持并弘扬以人为本,本在心;以厚为道,道在行。创造机遇,成就潜能。IT成就最大潜能的企业文化,努力成为值得客户信赖的、具有独特价值的优秀企业,并使之基业长青。
李平北京百里半网络技术有限公司
北京百里半网络技术有限公司为武汉厚溥企业集团成员单位,致力于互联网相关信息技术产品和服务的研究与开发,以及在线教育行业产品、服务的集成运营。公司拥有雄厚的具备学术、教育及产业背景的研发团队。
公司为政府、高校、企业等提供极具竞争力的产品服务。在人工智能、大数据及IT运维、互联网用户行为分析、在线教育等领域推出了自有知识产权的独特而领先的产品,为公司的持续发展奠定了坚实的基础。
北京百里半网络技术有限公司长期以来坚持并弘扬以人为本,本在心;以厚为道,道在行。创造机遇,成就潜能。IT成就最大潜能的企业文化,努力成为值得客户信赖的、具有独特价值的优秀企业,并使之基业长青。
李平
李平,男,1981年出生,工学博士,任教于黄冈师范学院数学与统计学院。主要研究方向为大数据技术与应用、数学建模等,有丰富的高校教学经验与企业实践经历,发表科研论文十余篇,主持参与省部级科研项目三项,多次指导本专科学生及研究生参加数据挖掘竞赛、数学建模竞赛并获得国家级奖项。
目錄
第1章 大数据概述1
1.1 大数据与数据分析2
1.1.1 Hadoop的基础组件2
1.1.2 Hadoop分布式文件系统3
1.1.3 MapReduce3
1.1.4 YARN4
1.2 ZooKeeper5
1.3 Hive6
1.4 与其他系统集成7
1.4.1 Hadoop生态系统7
1.4.2 数据集成与Hadoop8
1.4.3 Hadoop商用平台CDH9
第2章 Hadoop存储13
2.1 HDFS的基础知识14
2.1.1 HDFS概念14
2.1.2 架构18
2.1.3 接口21
2.2 在分布式模式下设置HDFS集群26
2.3 HDFS的高级特性30
2.3.1 快照30
2.3.2 离线查看器33
2.3.3 分层存储39
2.4 文件格式42
2.5 云存储43
第3章 数据仓库和Hive45
3.1 数据仓库和Hive简介45
3.1.1 数据仓库简介45
3.1.2 数据仓库与数据库的区别46
3.1.3 Hive简介46
3.1.4 查看CDH中Hive版本47
3.2 Hive与数据库48
3.2.1 Hive与RDBMS48
3.2.2 HiveQL与SQL50
3.3 Hive的高级特性51
3.3.1 Hive的优缺点和适用场景52
3.3.2 Hive进程介绍52
3.3.3 Hive访问方式53
3.3.4 Hive体系结构53
3.3.5 Hive Metastore55
3.3.6 Hive数据类型56
3.3.7 Hive的常用参数配置57
3.3.8 Hive的数据模型58
3.3.9 Hive函数62
3.4 案例演示66
3.4.1 准备数据67
3.4.2 修改和查询71
3.4.3 表连接72
3.4.4 创建视图74
3.4.5 创建索引75
3.4.6 JDBC开发76
3.4.7 UDF的开发84
3.4.8 UDAF86
3.5 Hive优化和Hive中的锁87
3.5.1 注意事项87
3.5.2 Hive锁88
3.6 问题汇总89
第4章 Hadoop计算91
4.1 Hadoop MapReduce的基础91
4.1.1 概念92
4.1.2 架构94
4.2 启动MapReduce作业99
4.2.1 编写map任务100
4.2.2 编写reduce任务102
4.2.3 编写MapReduce作业103
4.2.4 MapReduce配置105
4.3 MapReduce的高级特性106
4.3.1 分布式缓存106
4.3.2 计数器108
4.3.3 作业历史服务器109
第5章 Hadoop安全113
5.1 提升Hadoop集群安全性114
5.1.1 边界安全114
5.1.2 Kerberos认证115
5.1.3 Hadoop中的服务级授权120
5.2 提升数据安全性124
5.2.1 数据分类125
5.2.2 将数据传到集群125
5.2.3 保护集群中的数据130
5.3 增强应用程序安全性134
5.3.1 YARN 架构134
5.3.2 YARN中的应用提交135
第6章 Flume分布式日志处理系统139
6.1 Flume介绍139
6.1.1 Flume简介140
6.1.2 Flume原理141
6.1.3 Flume特点143
6.1.4 Flume结构143
6.1.5 Flume使用156
6.2 Flume使用案例159
6.2.1 Flume监听端口示例159
6.2.2 两个主机组成的Flume集群示例162
6.2.3 HDFS Sink使用示例164
6.2.4 扇出示例167
6.2.5 负载均衡Sink组示例169
6.3 Flume开发案例178
6.3.1 开发自定义的Sink178
6.3.2 Flume结合Kafka的使用183
第7章 Spark及其生态圈概述203
7.1 Spark 简介203
7.1.1 什么是Spark203
7.1.2 Spark与MapReduce比较206
7.1.3 Spark的演进路线图206
7.2 Spark生态系统207
7.2.1 Spark Core208
7.2.2 Spark Streaming209
7.2.3 Spark SQL211
7.2.4 BlinkDB213
7.2.5 MLBaseMLIib213
7.2.6 GraphX214
7.2.7 SparkR215
7.2.8 Alluxio216
7.3 小结217
內容試閱
大数据是什么?在过去的十年间,恐怕没有一个词比大数据更高频了,也没有一个概念如大数据一样,众说纷纭。2014年,阿里巴巴集团总裁马云提出,人类正从IT时代走向DT时代。DTdata technology时代,以服务大众、激发生产力为主。以物联网、云计算、大数据和人工智能为代表的新技术革命正在渗透至各行各业,改变着我们的生活。
Hadoop是Apache软件基金会下的一个顶级项目,它是目前大数据行业的基础支撑。Hadoop改变了大数据的存储、处理和分析的过程,强有力地驱动了大数据行业的发展,形成了自己的生态圈。
《Hadoop理论与实践》对Hadoop的架构、原理和生态系统组成进行了详细的解读,结构清晰,对于需要详细了解和应用Hadoop的读者是一个不错的选择。
《Hadoop理论与实践》是北京百里半网络技术有限公司所编著的大数据人工智能系列丛书中的一本,它为该系列的其他几本专业教材提供了大数据入门的支撑。
《Hadoop理论与实践》凝聚了编委会多年来的教学经验和成果,内容安排合理,层次清晰,通俗易懂,实例丰富,突出理论和实践相结合,可作为各类高等院校教材,也可供广大程序设计人员参考。
《Hadoop理论与实践》由北京百里半网络技术有限公司和李平老师编著。《Hadoop理论与实践》编者长期从事项目开发和教学实施,并且对当前高校的教学情况非常熟悉,在编写过程中充分考虑到不同学生的特点和需求,加强了项目实战方面的教学。在《Hadoop理论与实践》的编写过程中,得到了武汉厚溥教育科技有限公司各级领导的大力支持,在此对他们表示衷心的感谢。
为便于教学,《Hadoop理论与实践》提供PPT教学课件和案例源文件,这些资源可通过扫描下方二维码下载。
PPT课件、案例源文件
限于编写时间和编者的水平,书中难免存在不足之处,希望广大读者批评指正。
服务邮箱:476371891@qq.com。

编 者
2020年8月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.