新書推薦:
《
可转债——新手理财的极简工具
》
售價:HK$
66.7
《
新加坡教育:神话与现实
》
售價:HK$
98.9
《
“口袋中的世界史”第一辑·冷战中的危机事件
》
售價:HK$
299.0
《
绝美的奥伦堡蕾丝披肩编织
》
售價:HK$
181.7
《
狂飙年代:18世纪俄国的新文化和旧文化(第二卷)
》
售價:HK$
177.0
《
万有引力书系 纳粹亿万富翁 德国财富家族的黑暗历史
》
售價:HK$
112.7
《
中国常见植物野外识别手册:青海册
》
售價:HK$
78.2
《
三星堆对话古遗址(从三星堆出发,横跨黄河流域,长江流域,对话11处古遗址,探源多元一体的中华文明)
》
售價:HK$
89.7
|
內容簡介: |
本书以项目任务为载体串联知识与技能,介绍基于 Spark SQL 技术的大数据分析方法,培养 学习者使用 Spark SQL 技术解决实际数据分析问题的能力,主要内容有大数据分析概述、实践环 境准备、学生信息处理分析、房产大数据分析与探索、电商大数据分析与探索、Zepplin 数据可视 化。在实现任务的过程中详细阐述了 Scala 语言基础、Spark SQL 编程分析、Spark SQL 数据分 析与探索、数据可视化等知识。本书适合作为高等职业院校计算机、大数据、人工智能及相关专业的教材或参考书,也可以 作为数据分析人员的参考书。
|
關於作者: |
许慧(1991.10—),女,浙江大学空天信息技术硕士,衢州职业技术学院专职教师,从事大数据技术教学和科研工作。2022年主持”浙江省高等学校课程思政示范课程项目”《大数据集群环境搭建实训》课程建设项目。主持”衢州职业技术学院课程思政示范课程项目”《大数据挖掘与分析》课程建设。主持2019年衢州市指导性科技计划项目\基于大数据的衢州电商客户数据信息安全技术研究”。
|
目錄:
|
第 1 章大数据分析概述 ..........................................................................................1任务 1.1 关于大数据分析............................................................................................. 1 情境导入 ........................................................................................................ 1 学习目标和要求 ............................................................................................ 11.1.1什么是大数据分析 ............................................................................ 21.1.2大数据分析工具 ................................................................................ 51.1.3大数据分析可视化 ............................................................................ 8 任务 1.2认识 Spark SQL ............................................................................................. 8 情境导入 ........................................................................................................ 8 学习目标和要求 ............................................................................................ 81.2.1Spark SQL 的背景简介 ..................................................................... 91.2.2 Spark SQL 的运行原理 ................................................................... 10 脑图小结......................................................................................................................... 14 章节练习......................................................................................................................... 16第 2 章实践环境准备 ...........................................................................................17任务 2.1 Hadoop 集群环境搭建 ................................................................................. 17 情境导入 ...................................................................................................... 17 学习目标和要求 .......................................................................................... 182.1.1环境准备 .......................................................................................... 182.1.2安装 Hadoop..................................................................................... 352.1.3启动 Hadoop 集群............................................................................ 452.1.4运行经典案例 wordcount ................................................................ 48 任务 2.2Spark 集群部署与使用 ................................................................................ 50 情境导入 ...................................................................................................... 50 学习目标和要求 .......................................................................................... 502.2.1安装 Spark ........................................................................................ 502.2.2启动 Spark ........................................................................................ 542.2.3Spark 集群测试 ................................................................................ 56任务 2.3 安装 Scala ..................................................................................................... 60 情境导入 ...................................................................................................... 60 学习目标和要求 .......................................................................................... 602.3.1下载 Scala 安装包............................................................................ 612.3.2 Scala 安装配置................................................................................. 61 脑图小结......................................................................................................................... 62 章节练习......................................................................................................................... 63第 3 章学生信息处理分析 ....................................................................................65任务 3.1 班级基本情况分析....................................................................................... 66 情境导入 ...................................................................................................... 66 学习目标和要求 .......................................................................................... 663.1.1学生所属班级和男女生数量 .......................................................... 673.1.2以班级为单位整理学生信息 .......................................................... 84 任务 3.2学生基本情况分析....................................................................................... 96 情境导入 ...................................................................................................... 96 学习目标和要求 .......................................................................................... 963.2.1学生特长情况分析 .......................................................................... 963.2.2 学生成绩情况分析 ........................................................................ 102 脑图小结....................................................................................................................... 105 章节练习....................................................................................................................... 106第 4 章房产大数据分析与探索 ...........................................................................108任务 4.1 某房产公司销售人员业绩分析............................................................... 108 情境导入 .................................................................................................... 108 学习目标和要求 ........................................................................................ 1104.1.1数据集处理 .................................................................................... 1104.1.2数据操作分析 ................................................................................ 116 任务 4.2某城市近年房产销售状况分析................................................................. 131 情境导入 .................................................................................................... 131学习目标和要求 ........................................................................................ 1324.2.1数据准备 ........................................................................................ 1324.2.2数据探索与分析 ............................................................................ 1344.2.3总结分析 ........................................................................................ 139脑图小结....................................................................................................................... 139章节练习....................................................................................................................... 140第 5 章电商大数据分析与探索 ...........................................................................141任务 5.1 “女装电子商务评论”数据分析........................................................ 141 情境导入 .................................................................................................... 141 学习目标和要求 ........................................................................................ 1425.1.1数据准备 ..................................................................................... 1425.1.2数据清洗 ..................................................................................... 1525.1.3数据转换 ..................................................................................... 1575.
|
|