新書推薦:
《
李白传(20世纪文史学家李长之经典传记)
》
售價:HK$
45.8
《
津轻:日本无赖派文学代表太宰治自传性随笔集
》
售價:HK$
66.7
《
河流之齿
》
售價:HK$
59.8
《
新经济史革命:计量学派与新制度学派
》
售價:HK$
89.7
《
盗墓笔记之秦岭神树4
》
售價:HK$
57.3
《
战胜人格障碍
》
售價:HK$
66.7
《
逃不开的科技创新战争
》
售價:HK$
103.3
《
漫画三国一百年
》
售價:HK$
55.2
|
內容簡介: |
作为问题导向、数据驱动的交叉学科,数据科学要求研究者具备扎实的知识储备、高效的编程能力以及广阔的研究视野。本书尝试以概论的形式对数据科学的缘起、内涵、技术、工具、原则、方法、平台、产品、应用等展开讨论,帮助读者建立完整的知识体系与专业逻辑。全书划分为四个部分:*部分是绪论,鸟瞰数据科学的概念、历史与应用;第二部分是基础技能,涵盖编程工具、数学基础与统计原则;第三部分是分析方法,遵从从探索性到验证性的数据分析思路,阐释数据可视化方法,讲解面向结构化数据的机器学习与人工智能模型,并讨论非结构化数据的分析技术;第四部分是数据应用,从业界视角介绍数据库、大数据平台、可重复研究的理念与实践,并以互联网、零售、金融、医疗健康四个行业为例展开实战讨论。
|
關於作者: |
李扬 中国人民大学统计学院教授、博士生导师,副院长、统计咨询研究中心主任;国际统计学会推选会员、中国商业统计学会副会长、北京生物医学统计与数据管理研究会监事长、北京大数据协会综合评价专业委员会主任委员。主要从事相关型数据分析、模型选择与不确定性评价、潜变量建模、临床试验设计等领域研究,承担国家自然科学基金面上项目、全国统计科学研究重大项目等科研项目二十余项,发表JASA、JAMA?IM、Biometrics、Biostatistics、统计研究等国内外期刊研究论文五十余篇。
李舰 统计学本科、软件工程硕士、商学博士,数据科学领域的多年从业者,见证并参与了统计学从冷门专业到显学的过程。是统计之都社区的核心成员之一、一些开源社区的活跃贡献者,致力于数据科学在实体行业的应用。著有《统计之美》《数据科学中的R语言》。
|
目錄:
|
第 1章绪论
1.1数据科学的概念
1.1.1数据科学的研究对象
1.1.2常见的数据科学方法
1.2数据科学的发展变迁
1.2.1数据科学的前身:统计学
1.2.2当代统计学:数据科学
1.3数据科学的应用领域
1.3.1互联网行业
1.3.2零售行业
1.3.3金融行业
1.3.4医疗健康行业
第 2章数据科学的编程工具
2.1 R简介
2.1.1安装和设置
2.1.2基础操作
2.1.3数据结构
2.1.4基础语法
2.2 Python和数据科学
2.2.1安装和使用
2.2.2数据结构
2.2.3基础语法
2.3 Julia简介
2.3.1安装和使用
2.3.2编程基础
第 3章数据科学的数学基础
3.1线性代数
3.1.1向量基础
3.1.2矩阵运算
3.2概率论和数理统计
3.2.1随机变量和分布
3.2.2数理统计简介
3.3最优化方法
3.3.1非线性规划
3.3.2线性规划
第 4章数据科学的统计原则
4.1可重复原则
4.1.1数据的扰动
4.1.2模型的扰动
4.2可预测原则
4.2.1可预测性
4.2.2交叉验证
4.3可计算原则
4.3.1大数据时代的数据特征
4.3.2大规模数据的处理方法
4.3.3高维 超高维数据的处理方法
第 5章数据可视化
5.1基础统计图形
5.1.1图形设备
5.1.2基础作图
5.1.3 ggplot绘图语言
5.2可视化与数据分析
5.2.1单变量的分布
5.2.2两变量的关系
5.2.3多变量的关系
5.3现代数据可视化方法
5.3.1动态统计图形
5.3.2交互式工具
第 6章数据挖掘和机器学习
6.1从海量数据到大数据
6.1.1海量数据与数据挖掘
6.1.2大数据与机器学习
6.2无监督学习
6.2.1主成分分析
6.2.2聚类分析
6.3有监督学习
6.3.1回归分析
6.3.2分类问题和分类性能评估
6.3.3常用分类模型
第 7章人工智能
7.1人工智能简史
7.1.1人工智能的发展历史
7.1.2从神经网络到深度学习
7.2神经网络简介
7.2.1神经网络模型
7.2.2感知机的学习
7.2.3 BP算法
7.3深度学习基础
7.3.1常见深度学习框架
7.3.2 MXNet简介
7.3.3深度学习实战
第 8章非结构化数据分析
8.1图像分析
8.1.1图像处理基础
8.1.2卷积神经网络
8.1.3图像分类示例
8.2文本分析
8.2.1文本数据的处理
8.2.2文本分类示例
8.2.3句法分析
8.3音频分析
8.3.1音频数据的处理
8.3.2音频特征的提取
第 9章数据库和数据仓库
9.1数据结构简介
9.1.1数据的测量尺度
9.1.2数据的基础类型
9.1.3数据的逻辑结构
9.2数据库和 SQL
9.2.1数据库基础介绍
9.2.2常见的数据库产品
9.2.3 SQL语句简介
9.3数据仓库和商业智能
9.3.1数据仓库基础介绍
9.3.2数据仓库的多维模型
9.3.3 BI分析简介
第 10章大数据平台
10.1大数据和云计算
10.1.1大数据技术的发展变迁
10.1.2云计算简介
10.2并行计算框架
10.2.1并行计算简介
10.2.2共享内存和 GPU计算
10.2.3
|
|