新書推薦:
《
数据有道:数据分析+图论与网络+微课+Python编程(鸢尾花数学大系:从加减乘除到机器学习)
》
售價:HK$
266.6
《
500万次倾听:陪伤心的人聊聊
》
售價:HK$
53.8
《
英国商业500年(见证大国崛起与企业兴衰,启迪未来商业智慧。)
》
售價:HK$
80.6
《
万千心理·儿童心理治疗中的心智化:临床实践指导
》
售價:HK$
87.4
《
自我囚禁的人:完美主义的心理成因与自我松绑(破除你对完美主义的迷思,尝试打破自我评价过低与焦虑的恶性循环)
》
售價:HK$
66.1
《
周易
》
售價:HK$
44.6
《
东南亚的传统与发展
》
售價:HK$
67.2
《
乾隆制造
》
售價:HK$
87.4
|
編輯推薦: |
本书为校企合作教材,以某市出租车行业为企业大数据典型案例,引导学习案例不熟、项目数据源分析、项目设计、数据提取、数据清洗、数据存储、数据分析处理、ECharts的应用、Web前端后端可视化处理,让读者快速了解企业开发大数据流程,学会自己动手搭建环境开发应用。配有电子课件、源代码
|
內容簡介: |
本书以某市出租车行业为背景介绍大数据技术在项目中的应用。全书共10章,第1章交通大数据概述,第2章某市出租车实战案例部署,第3章某市出租车项目设计,第4章Python语言基础,第5章数据提取,第6章数据清洗,第7章数据存储,第8章数据分析处理,第9章ECharts的应用,第10章某市出租车综合编程实践。
本书适合作为各类职业院校大数据及相关专业的教材,也可作为大数据开发工程师及其他科技工作者的参考用书。
本书配有电子课件、源代码,选用本书作为授课教材的教师可登录机械工业出版社教育服务网(www.cmpedu.com)注册后免费下载。
|
目錄:
|
前 言
第1章 交通大数据概述........................................1
1.1 大数据概述.......................................................................................3
1.2 大数据处理过程................................................................................5
1.3 交通大数据的来源............................................................................7
1.4 交通大数据的应用............................................................................9
1.5 交通大数据发展面临的挑战.............................................................10
1.6 思考练习........................................................................................11
第2章 某市出租车项目实战案例部署.....................13
2.1 项目背景........................................................................................15
2.2 主要流程........................................................................................15
2.3 项目难点分析.................................................................................16
2.4 数据加载........................................................................................16
2.5 本地开发环境搭建..........................................................................20
2.6 发布Tomcat可视化页面.................................................................31
2.7 数据可视化效果展示.......................................................................34
2.8 思考练习........................................................................................44
第3章 某市出租车项目设计................................45
3.1 数据源...........................................................................................47
3.2 项目整体架构设计..........................................................................48
3.3 选择所需软件.................................................................................49
3.4 Hadoop集群规划...........................................................................49
3.5 大数据ETL过程..............................................................................50
3.6 思考练习........................................................................................53
第4章 Python语言基础...................................55
4.1 Python语言概述............................................................................57
4.2 PyCharm概述...............................................................................58
4.3 Python基础...................................................................................64
4.4 思考练习........................................................................................72
第5章 数据提取...............................................73
5.1 数据爬虫........................................................................................75
5.2 文件数据提取.................................................................................86
5.3 思考练习........................................................................................93
第6章 数据清洗..............................................95
6.1 数据清洗过滤.................................................................................97
6.2 各类格式文件的数据输出..............................................................105
6.3 思考练习......................................................................................110
第7章 数据存储..............................................111
7.1 HDFS加载存储............................................................................113
7.2 Sqoop加载存储...........................................................................116
7.3 思考练习......................................................................................120
第8章 数据分析处理.......................................121
8.1 MapReduce概述.........................................................................123
8.2 MapReduce体系结构..................................................................125
8.3 MapReduce工作流程............................
|
內容試閱:
|
随着大数据技术、移动设备和全球定位系统的发展,各行各业产生的数据已经能够被较为及时、全面地采集,这为大数据的分析与应用奠定了基础。本书介绍典型的大数据处理过程,在此基础上介绍大数据的主要来源以及典型应用,并提出了大数据技术在发展过程中可能面临的问题与挑战。
本书以企业大数据典型案例某市出租车行业为主要引导案例,一步步带领读者学习案例部署、项目数据源分析、项目设计、数据提取、数据清洗、数据存储、数据分析处理、ECharts的应用、Web前端后端可视化处理。本书可以让读者快速了解企业开发大数据案例的流程,学会自己动手搭建环境开发应用。
全书共10章,第1章着重介绍交通大数据的概念以及大数据在交通行业的应用;第2章介绍某市出租车项目实战案例部署,包括项目背景介绍、项目难点分析、开发环境的搭建、可视化页面部署等;第3章介绍某市出租车项目的设计,包括介绍数据源、项目整体设计、Hadoop集群规划、数据ETL过程;第4章介绍Python语言基础,包括Python语言、PyCharm编程工具;第5章是数据提取的动手实战,包括数据爬虫、文件数据提取;第6章着重介绍了数据清洗的过程,包括使用Python数据清洗过滤、各类格式文件清洗;第7章着重介绍了数据存储实战,包括HDFS的数据加载、Sqoop的数据加载;第8章为数据分析处理,包括MapReduce概述、体系结构、工作流程、开发环境配置及使用MapReduce实现各种统计;第9章介绍ECharts的应用,包括ECharts的基本概念、简单的ECharts入门;第10章是某市出租车综合编程实践,包括对项目的整体需求分析、项目总体架构、数据提取、数据过滤、处理缺失值、文件HDFS数据存储、数据转换、Sqoop导出数据、数据可视化开发。
本书由谭志彬、邓立、吴子颖担任主编,张正球、李东、潘翔担任副主编,佟铭欣、陈垦、黄晓航参加编写。
由于编者水平有限,书中难免存在不足之处,敬请读者批评指正。
|
|