新書推薦:
《
突破不可能:用特工思维提升领导力
》
售價:HK$
77.3
《
王阳明大传:知行合一的心学智慧(精装典藏版)
》
售價:HK$
221.8
《
失衡与重塑——百年变局下的中国与世界经济
》
售價:HK$
132.2
《
不被定义的年龄:积极年龄观让我们更快乐、健康、长寿
》
售價:HK$
77.3
《
南方谈话:邓小平在1992
》
售價:HK$
80.6
《
纷纭万端 : 近代中国的思想与社会
》
售價:HK$
109.8
《
中国古代文体形态研究(第四版)(中华当代学术著作辑要)
》
售價:HK$
168.0
《
朋党之争与北宋政治·大学问
》
售價:HK$
99.7
|
內容簡介: |
本书首先讲解Pandas快速入门的基础知识,如Pandas的定义、可处理的数据类型、优势、开发环境配置、常用的数据结构等;然后通过实例剖析讲解Pandas数据的导入、导出、查看、清洗、合并、对比、预处理;接着讲解Pandas数据的提取、筛选、汇总、统计及可视化;然后讲解Pandas数据的线性模型和广义线性模型,最后讲解Pandas数据实战分析。在讲解过程中即考虑读者的学习习惯,又通过具体实例剖析讲解Pandas实战应用中的热点问题、关键问题及种种难题。
|
關於作者: |
周峰,毕业于青岛海洋大学计算机科学与应用专业。曾先后就职于青岛商业中专和青岛远洋学院计算机系,从事计算机辅助设计的教学与研究。曾出版作品如下:《C语言实用程序设计100例》 《VB控件实用程序设计100例》 《计算机立体美术设计3ds max实例教程》《Flash MX 2004网络动画精彩实例创作通》
|
目錄:
|
第1章 Pandas快速入门11.1 初识Pandas21.1.1 什么是Pandas21.1.2 Pandas的主要数据结构21.1.3 Pandas的优势21.2 Pandas开发环境配置31.2.1 Python概述31.2.2 Anaconda概述51.2.3 Anaconda的下载51.2.4 Anaconda的安装81.2.5 Jupyter Notebook概述111.3 Jupyter Notebook界面的基本操作131.3.1 Jupyter Notebook的主界面131.3.2 Jupyter Notebook的编辑页面141.3.3 Jupyter Notebook的文件操作181.4 实例:第一个Pandas数据处理程序20第2章 Pandas常用的数据结构222.1 初识数据结构232.1.1 什么是数据及数据处理232.1.2 什么是信息232.1.3 什么是数据结构242.2 Python的数据结构242.2.1 数值型应用实例242.2.2 字符串型应用实例272.2.3 列表应用实例302.2.4 元组应用实例342.2.5 字典应用实例362.2.6 集合应用实例382.3 NumPy的数据结构402.3.1 NumPy数组的创建412.3.2 NumPy特殊数组422.3.3 NumPy序列数组432.3.4 NumPy数组运算442.3.5 NumPy的矩阵452.3.6 两个数组的点积462.3.7 两个向量的点积472.3.8 数组的向量内积482.3.9 矩阵的行列式492.3.10 矩阵的逆502.4 Pandas的数据结构512.4.1 一维数组系列应用实例522.4.2 二维数组应用实例53第3章 Pandas数据的导入与导出553.1 导入CSV文件563.1.1 CSV文件概述563.1.2 创建CSV文件,并输入内容563.1.3 read_csv()方法583.1.4 利用read_csv()方法导入CSV文件实例603.2 导入Excel文件633.2.1 在Excel中输入内容并上传633.2.2 read_excel()方法653.2.3 利用read_excel()方法导入Excel文件实例663.3 导入JSON文件683.3.1 创建JSON文件,并输入内容683.3.2 read_json()方法693.3.3 利用read_json()方法导入JSON文件实例703.4 Pandas数据的输出703.4.1 输出CSV文件713.4.2 输出Excel文件733.4.3 输出JSON文件76第4章 Pandas数据表的查看和清洗794.1 Pandas数据表信息的查看804.1.1 利用shape属性查看数据表的维度804.1.2 利用dtype和dtypes属性查看列数据的类型824.1.3 利用columns和values属性查看表头和数据表数据信息844.1.4 利用isnull()方法查看空值信息854.1.5 利用unique()方法查看列中的无重复数据信息874.1.6 利用info()方法查看数据表的基本信息884.1.7 利用head()方法查看数据表前几行数据894.1.8 利用tail()方法查看数据表后几行数据914.2 Pandas数据表的清洗924.2.1 空值的清洗924.2.2 格式错误数据的清洗974.2.3 错误数据的清洗984.2.4 重复数据的清洗1014.2.5 数据表列名的清洗1034.2.6 数据内容的清洗105第5章 Pandas数据的合并与对比1085.1 利用append()方法追加数据1095.1.1 append()方法及参数1095.1.2 利用append()方法实现相同结构数据表的数据追加1095.1.3 利用append()方法实现不同结构数据表的数据追加1115.1.4 利用append()方法实现忽略索引的数据追加1135.1.5 追加Series序列1155.1.6 追加字典列表1175.2 利用concat()方法合并数据1185.2.1 concat()方法及参数1185.2.2 利用concat()方法纵向合并数据1195.2.3 利用concat()方法横向合并数据1205.2.4 合并数据的交集1225.3 利用merge()方法合并数据1255.3.1 merge()方法及参数1255.3.2 利用merge()方法合并数据实例1265.4 利用compare()方法对比数据1305.4.1 compare()方法及参数1305.4.2 利用compare()方法对比数据实例131第6章 Pandas数据的预处理1356.1 设置索引列1356.1.1 Pandas索引的作用1366.1.2 set_index()方法及参数1366.1.3 利用set_index()方法设置索引列实例1376.1.4 利用reset_index()方法还原索引列实例1396.2 排序1416.2.1 按索引列排序1416.2.2 按指定列排序1446.3 分组标记1466.3.1 利用where()方法添加分组标记1466.3.2 根据多个条件进行分组标记1486.4 列的拆分151第7章 Pandas数据的提取1557.1 利用loc[ ]提取数据1557.1.1 利用loc[ ]提取整行数据1567.1.2 利用loc[ ]提取整列数据1587.1.3 利用loc[ ]提取具体数据1617.2 利用iloc[ ]提取数据1647.2.1 利用iloc[ ]提取整行数据1657.2.2 利用iloc[ ]提取整列数据1677.2.3 利用iloc[ ]提取具体数据1687.3 利用属性提取数据1707.4 利用For循环提取数据172第8章 Pandas数据的筛选1758.1 Pandas数据关系筛选1768.1.1 等于关系数据筛选实例1768.1.2 不等于关系数据筛选实例1788.1.3 大于和大于等于关系数据筛选实例1808.1.4 小于和小于等于关系数据筛选实例1828.2 Pandas数据逻辑筛选1838.2.1 使用“与”进行数据筛选实例1838.2.2 使用“或”进行数据筛选实例1858.2.3 使用“非”进行数据筛选实例1868.3 使用query()方法进行数据筛选实例1888.4 使用filter()方法进行数据筛选1928.4.1 filter()方法及意义1938.4.2 使用filter()方法进行数据筛选实例193第9章 Pandas数据的聚合函数1979.1 sum()函数的应用1979.1.1 sum()函数及参数1989.1.2 sum()函数应用实例1989.2 mean()函数的应用2029.2.1 mean()函数及参数2039.2.2 mean()函数应用实例2039.3 max()函数的应用2079.3.1 max()函数及参数2079.3.2 max()函数应用实例2079.4 min()函数的应用2109.4.1 min()函数及参数2109.4.2 min()函数应用实例2119.5 count()函数的应用2139.5.1 count()函数及参数2149.5.2 count()函数应用实例214第10章 Pandas数据的分组与透视21710.1 Pandas数据的分组21810.1.1 groupby()方法及参数21810.1.2 groupby()方法的应用21810.1.3 agg()方法的应用22310.1.4 transform()方法的应用22610.2 Pandas数据的透视23010.2.1 pivot_table()方法及参数23010.2.2 利用pivot_table()方法透视数据实例23110.2.3 crosstab()方法及参数23510.2.4 利用crosstab()方法透视数据实例236第11章 Pandas数据的统计24311.1 数据采样24311.1.1 sample()方法及参数24411.1.2 利用sample()方法进行数据采样实例24411.2 数据统计24911.2.1 数据表描述性统计24911.2.2 利用describe()方法进行数据表描述性统计实例25011.2.3 中位数的应用25511.2.4 方差的应用26011.2.5 标准差的应用26311.3 数据相关性分析26711.3.1 协方差的应用26711.3.2 协方差相关系数的应用270第12章 Pandas数据的可视化27512.1 利用Pandas中的plot()方法绘图27612.1.1 plot()方法及参数27612.1.2 绘制折线图实例27712.1.3 绘制条形图实例27912.1.4 利用plot()方法绘制其他类型图形实例28312.2 利用Matplotlib包绘制Pandas数据图形28712.2.1 figure()方法的应用实例28812.2.2 plot()方法的应用实例29012.2.3 subplot()方法的应用实例29412.2.4 add_axes()方法的应用实例29612.2.5 legend()方法的应用实例29812.2.6 设置线条的宽度和颜色实例30012.2.7 添加坐标轴网格线实例302第13章 Pandas数据的机器学习算法30313.1 机器学习概述30413.1.1 什么是机器学习30413.1.2 机器学习的类型30413.2 常见的机器学习算法30513.3 机器学习的sklearn包30713.3.1 sklearn包中的数据集30813.3.2 iris数据集30813.3.3 查看iris数据集实例30913.4 决策树31413.4.1 决策树的组成31513.4.2 决策树的优点31513.4.3 决策树的缺点31613.4.4 决策树实现实例31613.5 随机森林31813.5.1 随机森林的构建31813.5.2 随机森林的优缺点31813.5.3 随机森林的应用范围31913.5.4 随机森林实现实例31913.6 支持向量机32113.6.1 支持向量机的工作原理32113.6.2 核函数32213.6.3 支持向量机的优点32413.6.4 支持向量机的缺点32413.6.5 支持向量机实现实例32513.7 朴素贝叶斯算法32813.7.1 朴素贝叶斯算法的思想32913.7.2 朴素贝叶斯算法的步骤32913.7.3 朴素贝叶斯算法的优缺点33013.7.4 高斯朴素贝叶斯模型实现实例33013.7.5 多项式分布朴素贝叶斯模型实现实例33313.7.6 伯努力朴素贝叶斯模型实现实例336第14章 Pandas的时间序列数据33814.1 Pandas时间序列的创建33914.1.1 date_range()方法及参数33914.1.2 利用date_range()方法创建时间序列实例34014.1.3 时间戳对象34114.2 时间类型与字符串类型的转换34314.3 时间序列数据的操作技巧34514.3.1 时间序列数据的提取34514.3.2 时间序列数据的筛选34914.3.3
|
|