新書推薦:
《
史铁生:听风八百遍,才知是人间(2)
》
售價:HK$
55.8
《
量子网络的构建与应用
》
售價:HK$
109.8
《
拍电影的热知识:126部影片里的创作技巧(全彩插图版)
》
售價:HK$
109.8
《
大唐名城:长安风华冠天下
》
售價:HK$
87.4
《
情绪传染(当代西方社会心理学名著译丛)
》
售價:HK$
88.5
《
中国年画 1950-1990 THE NEW CHINA: NEW YEAR PICTURE 英文版
》
售價:HK$
236.0
《
革命与反革命:社会文化视野下的民国政治(近世中国丛书)
》
售價:HK$
93.2
《
画楼:《北洋画报》忆旧(年轮丛书)
》
售價:HK$
337.5
|
內容簡介: |
本书共10章,对数据统计与分析理论进行了较为全面的介绍。具体内容包括:数据统计基础、常用描述性统计分析、参数估计、假设检验、多元正态分布统计基础、方差分析、相关分析与回归分析、主成分分析与因子分析、聚类分析与判别分析、时间序列分析。全书论述严谨,行文深入浅出,注重实用性。本书可作为数据科学与大数据技术专业的本科生、研究生教学用书,也可作为相关专业本科生、研究生和数据统计分析与数据挖掘技术研究学者的参考书。
|
目錄:
|
前言第1章数据统计基础1.1统计及统计工作过程1.1.1统计含义1.1.2统计工作过程1.2总体和样本1.2.1总体与总体单位1.2.2样本1.3标志与变量1.3.1标志1.3.2变量1.3.3计量尺度1.4统计指标和指标体系1.4.1统计指标1.4.2统计指标体系1.5数据收集与处理1.5.1数据来源1.5.2数据质量1.5.3数据处理1.5.4数据显示练习题第2章常用描述性统计分析2.1数据对比分析2.1.1对比分析2.1.2相对数计算2.2集中趋势测量2.2.1非数值型数据集中趋势测量2.2.2数值型数据集中趋势测量2.3离散趋势测量2.3.1非数值型数据离散趋势测量2.3.2数值型数据离散趋势测量练习题第3章参数估计3.1抽样分布及常用统计量分布3.1.1抽样3.1.2抽样分布3.1.3常用统计量分布3.2点估计3.2.1估计量与估计值3.2.2总体参数点估计3.3总体参数区间估计3.3.1区间估计基本原理3.3.2均值抽样极限误差3.3.3正态总体均值区间估计3.3.4正态总体方差区间估计3.4样本容量的确定练习题第4章假设检验4.1假设检验原理4.1.1假设检验基本原理4.1.2假设检验类型4.1.3假设检验中的两类错误4.2总体均值假设检验4.2.1大样本情形下总体均值假设检验4.2.2小样本情形下总体均值假设检验4.2.3两个正态总体均值之差假设检验4.3正态总体方差假设检验4.3.1单个总体方差假设检验4.3.2两正态总体方差齐性假设检验4.4分布拟合优度检验4.4.1拟合优度检验4.4.2总体含未知参数分布的拟合优度检验4.5独立性检验4.5.1独立性等价条件4.5.2独立性卡方检验4.6秩和检验4.6.1秩与秩和4.6.2配对符号秩检验4.6.3Wilcoxon秩和检验4.6.4Wilcoxon秩和检验临界点练习题第5章多元正态分布统计基础5.1多元统计基本概念5.1.1多元随机向量数字特征5.1.2随机向量相互独立性5.2多元正态分布5.2.1多元正态分布的概念5.2.2多元正态分布的基本性质5.2.3多元统计量分布及其性质5.3多元正态分布参数估计5.3.1多元正态分布参数的极大似然估计5.3.2参数估计量的基本性质5.4多元正态分布参数假设检验5.4.1多元正态分布均值向量检验5.4.2多元正态分布协方差检验练习题第6章方差分析6.1方差分析原理6.1.1方差分析的意义6.1.2方差分析的基本原理6.2单因素方差分析6.2.1单因素方差分析统计假设6.2.2构建单因素方差分析检验统计量6.2.3单因素方差分析表6.3无交互作用双因素方差分析6.3.1无交互作用双因素方差分析统计假设6.3.2构建无交互作用双因素方差分析检验统计量6.3.3无交互作用双因素方差分析表6.4交互作用双因素方差分析6.4.1交互作用双因素方差分析统计假设6.4.2构建交互作用双因素方差分析检验统计量6.4.3交互作用双因素方差分析表6.5多元方差分析6.5.1多元方差分析统计假设6.5.2构建检验统计量练习题第7章相关分析与回归分析7.1相关分析与回归分析原理7.1.1相关分析基本原理7.1.2回归分析基本原理7.1.3相关分析和回归分析的联系与区别7.2相关关系7.2.1相关关系判断7.2.2相关系数矩阵7.3一元线性回归7.3.1一元线性回归模型及其回归系数7.3.2回归直线拟合程度7.3.3回归分析统计检验7.3.4回归预测7.4多元线性回归7.4.1多元线性回归模型及其回归系数7.4.2多元线性回归模型误差估计7.4.3多元线性回归的统计检验7.5非线性回归练习题第8章主成分分析与因子分析8.1主成分分析与因子分析原理8.1.1主成分分析基本原理8.1.2因子分析基本原理8.1.3主成分分析和因子分析的区别与联系8.2主成分分析8.2.1主成分分析的数学模型8.2.2主成分载荷阵8.2.3主成分方差贡献率8.2.4主成分分析步骤8.3因子分析8.3.1因子分析数学模型8.3.2因子载荷阵8.3.3公共因子方差贡献8.3.4因子变量命名解释练习题第9章聚类分析与判别分析9.1聚类分析原理9.2系统聚类分析9.2.1系统聚类9.2.2统计相似性度量9.2.3系统聚类分析方法9.3判别分析原理9.4判别分析9.4.1费希尔判别法9.4.2贝叶斯多类判别法9.4.3逐步判别分析法练习题第10章时间序列分析10.1时间序列10.1.1时间序列概念10.1.2时间序列构成要素10.1.3时间序列平稳性10.2趋势外推拟合预测法10.2.1趋势外推拟合模型选择10.2.2趋势线性拟合预测模型10.2.3趋势曲线拟合预测模型 10.3平滑法10.3.1时间序列平滑模型10.3.2简单移动平均法10.3.3加权移动平均法10.3.4趋势移动平均法10.3.5指数平滑法练习题附表附表1几种常用的概率分布表附表2标准正态分布表附表3泊松分布表附表4χ2分布表附表5t分布表附表6F分布表附表7符号检验界域表附表8威尔科克森符号秩和检验临界值(T值)表附表9秩和临界值表参考文献
|
內容試閱:
|
本着“树精品意识、出优秀教材”的宗旨,全国高校人工智能与大数据创新联盟牵头组织编写了本书,它填补了我国应用型本科院校人工智能与大数据教材市场的空白。数据是当代为热门的词汇之一。人们身边许许多多发生的事情被记录,并成为数据的一部分。所谓数据,不仅仅是常见的阿拉伯数字所表示的形式,图片、声音、各种字母组合等都称为数据。数据是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物未经加工的原始素材。数据的表现形式还不能完全表达其内容,需要经过解释,并且数据和关于数据的解释是不可分的。数据的解释是指对数据含义的说明,数据的含义称为数据的语义,数据与其语义是不可分的。随着计算机运算速度和存储能力的发展,收集数据变得越来越简单,存储数据的成本越来越低,人们所掌握的数据量越来越大,数据存在形式的复杂度越来越高,但人们关心的不是数据本身,而是在这如此巨大的数据中可以得到什么样的信息,可以得到多少有用的信息,这就是数据挖掘理论所要研究的问题。统计学是通过搜索、整理、分析、描述数据等手段,推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其他学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。大数据时代的到来,给统计学带来了机遇和挑战,为统计学计量方式和方法的创新带来了良好的机会和动力。统计学本身是大数据时代的一门重要科学,也是数据挖掘的重要组成部分。随着大数据逐渐走进人们的视野并且在越来越多的领域当中予以应用,统计学也必然会迎来更广泛的关注和应用。本书的编写目的是结合大数据时代对统计学理论的要求,对统计学进行系统介绍,以利于统计学理论更好地服务于大数据时代,为统计学理论在大数据时代下的可持续发展和研究提供参考。基于这一初衷,本书具有如下特色:,对数据统计学的基本概念进行了较详细的介绍,并介绍了与数据挖掘算法相关的理论,为读者学习一些基本概念和基本理论提供方便。第二,基于大数据时代的需求,介绍了多元正态统计分析理论,同时介绍了分布拟合优度检验、总体独立性检验、多元方差分析、多元回归分析、降维理论等数据分析方法。第三,结合数据挖掘主要任务,对数据分类分析、聚类分析及时间序列分析进行了讲述,并介绍了衡量相似性的指标设计,阐述了数据挖掘的统计聚类和分类方法,如系统聚类法,费希尔判别、贝叶斯多类判别及逐步判别分析等分类方法,以及时间序列分析的趋势拟合法和平滑法。本书紧紧围绕数据挖掘来介绍统计学理论,将数据挖掘理论与统计学理论相融合,为读者学习和研究数据挖掘技术提供了很好的理论平台。全书论述严谨,行文深入浅出,注重实用性。希望读者能够通过本书的学习,获得数据与统计分析比较系统的知识,了解处理非确定现象一些常用的统计方法,为后续的分析研究打下牢固的理论基础。赵宏伟教授及陈达人、丁宇等在本书编写过程中提出了很多意见和建议,在此向他们表示感谢。统计学理论是一个非常严谨、非常成熟的理论。大数据时代的到来,极大弱化了统计学理论——抽样理论在大数据研究领域的重要作用,如何重构统计学理论,使其在大数据时代继续承担原有的历史任务,是统计学研究工作者所面临的一个挑战,也是历史所赋予的责任。由于编者水平有限,加之时间仓促,疏漏之处在所难免,恳请广大读者批评指正。编者
|
|