登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書

『簡體書』R统计与数据可视化:社会科学数据分析实践(全彩)

書城自編碼: 3906802
分類:簡體書→大陸圖書→教材研究生/本科/专科教材
作者: David S. Brown[戴维·S.布朗]
國際書號(ISBN): 9787121461910
出版社: 电子工业出版社
出版日期: 2023-09-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 204.5

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
中国网络文学年鉴(2023)
《 中国网络文学年鉴(2023) 》

售價:HK$ 457.7
美国学院和大学史(大学、思想与社会)
《 美国学院和大学史(大学、思想与社会) 》

售價:HK$ 112.7
好望角丛书·自由古巴:革命、救赎与新生
《 好望角丛书·自由古巴:革命、救赎与新生 》

售價:HK$ 170.2
颠覆者:美国散户如何凭借数字平台在华尔街实现逆袭
《 颠覆者:美国散户如何凭借数字平台在华尔街实现逆袭 》

售價:HK$ 90.9
投诉是礼物:理论版+实践版(套装2册)  长盛不衰的客户服务指南!
《 投诉是礼物:理论版+实践版(套装2册) 长盛不衰的客户服务指南! 》

售價:HK$ 135.7
女性史:革命与战争时期卷(一次重构人类历史的努力)
《 女性史:革命与战争时期卷(一次重构人类历史的努力) 》

售價:HK$ 135.7
永无止尽的狂热:三岛由纪夫
《 永无止尽的狂热:三岛由纪夫 》

售價:HK$ 68.8
原来这就是逻辑学:16堂大师逻辑课
《 原来这就是逻辑学:16堂大师逻辑课 》

售價:HK$ 57.3

 

建議一齊購買:

+

HK$ 60.3
《Python Web开发技术与应用(Flask版)(微课版)》
+

HK$ 59.8
《Python基础入门(第2版·项目案例·题库·微课视频版)》
+

HK$ 71.4
《Python程序设计》
+

HK$ 66.6
《SPSS统计分析高级教程》
+

HK$ 84.5
《Python数据挖掘实战(微课版)》
+

HK$ 75.6
《大学生职业生涯规划实训教程》
編輯推薦:
学习统计学及数据分析的艺术与实践的最好方式,就是进行数据分析。本书用大量案例辅以数据可视化,将统计学知识融汇其中,循循善诱,帮助读者避坑排雷,培养正确的数据分析思维方式。本书适合数据分析初学者,也适合有经验的数据分析人员。
內容簡介:
本书讲解了数据分析的方法、逻辑、艺术与实践。全书共17章,第1章介绍了R、RStudio、R Markdown 的安装和使用;第2章介绍了数据分析的动机和四个构成要素:①描述数据并形成假设,②模型的构建与估计,③诊断,④提出下一个问题,后续章节将按照数据分析构成要素的顺序来组织;对数据了解得越多,我们就越能够提出更好的问题,形成更好的假设,描述与数据相关的概念和所需的工具,这些内容将在第3~9章中详述;模型的构建与估计是一个应该在理论和证据之间来回往复迭代的过程,关于构建模型的练习将在第10~14章中进行;诊断既能帮助我们发现问题,又能帮助我们发掘有意义的关联,形成额外的解释或假设,关于诊断将会在第15章和第16章中详述;第17章将讨论许多涉及二元因变量的问题;附录A将提供创建其他新假设的技巧和窍门。
本书的基本理念是通过上手操作来学习。学习统计学以及数据分析的艺术与实践的最好方式,就是进行数据分析。本书用大量案例辅以数据可视化,将统计学知识融汇其中,循循善诱,帮助读者避坑排雷,培养正确的数据分析思维方式。本书适合数据分析初学者,也适合有经验的数据分析人员。
關於作者:
作者简介
David S. Brown(戴维·S.布朗):科罗拉多大学博尔德分校政治学教授和社会科学系主任。获得了加利福尼亚大学洛杉矶分校的政治学博士学位,并且是科罗拉多大学博尔德分校行为科学研究所肯尼斯·博尔丁(他开辟了多个经济学和社会科学研究领域)的首届博士后研究员。在加入科罗拉多大学政治学系之前,他曾在莱斯大学担任助理教授。他研究的是比较政治学,侧重于体制及其对经济发展的影响。他的研究成果已发表在《美国政治科学评论》(American Political Science Review)、《美国政治学期刊》(American Journal of Political Science)、《英国政治学期刊》(British Journal of Political Science)和《美国地理学家协会年鉴》(Annals of the Association of American Geographers)上。

译者简介
李嘉平:曾在华大基因从事生物信息分析相关工作,目前就职于广西医科大学第一附属医院(广西心脑血管疾病防治精准医学重点实验室)。他是R布道师,希望能够通过翻译传播和推广R的应用与价值;亦是R铁杆用户,具有丰富的生物信息分析经验,擅长使用R和Python进行各类数据处理以及数据可视化。曾负责生物信息培训中所有R相关课程的设计与授课。对新技术始终抱有极大的热情,喜欢去体验那些目前仍不完善但有前景的新技术,并享受这个过程带来的乐趣与启发。
目錄
目录
第1章 ? 入门指南 001
概述 001
R、RStudio 和R Markdown 002
对象与函数 004
RStudio 入门 006
RStudio 的R Markdown 导览 012
R Markdown 文件与R 脚本 017
小练习 019

第2章 ? 数据分析导论 027
概述 027
数据分析的动机 028
大数据越来越大 028
数据分析是一项有市场需求的技能 029
数据分析是一种公益 030
数据分析的构成要素 031
描述数据并形成假设 033
假设一:民族语言碎片化 034
假设二:女性选举权 040
假设三:人力资本 046
假设四:政治稳定 048
模型的构建与估计 052
诊断 054
结果的稳定性 054
残差图 056
提出下一个问题 059

第3章 ? 描述数据 064
概述 064
数据集和变量 066
不同类型的变量 068
连续变量 069
分类变量 069
有序分类变量 070
描述数据可以节省时间和精力 073
数据的形状 073
数据的极差 077
辨识困惑、问题、假设和线索 079
困惑和问题:重要的区别 079
描述数据以改进问题 081
描述数据披露了更多线索 084
度量 086
有效性 086
可靠性 088

第4章 ? 集中趋势和离散程度 093
概述 093
集中趋势的度量:众数、平均数和中位数 094
众数 095
平均数 096
中位数 100
平均数与中位数 103
离散程度的度量:极差、四分位距和标准差 106
极差 107
四分位距 109
标准差 110
四分位距与标准差 116
关于方差的说明 117

第5章 ? 数据的单变量和双变量描述 123
概述 123
好的、差的和离群值 124
单变量数据的5 种视图 125
频率表 126
条形图 127
箱线图(或盒须图) 128
直方图 131
茎叶图 135
变量间是否相关 138
散点图 139
箱线图(双变量) 145
马赛克图 145
交叉表 148
气泡图 148

第6章 ? 数据变换 157
概述 157
数据变换的理论原因 158
变换数据确保符合理论 158
数据和问题都要变换以相互匹配 159
数据变换的实际原因 160
数据变换——从连续变量到分类变量 164
数据变换——改变类别 169
Box-Cox 变换 175

第7章 ? 数据展示的一些原则 186
概述 186
一些风格要素 187
消除杂乱 188
聚焦 190
整合图文 192
一图应该胜千言 195
了解你的受众 201
了解你的目的:解释性、探索性或信息性 203
故事的基本要素 208
文档(树立讲述者的可信度) 209
建立直觉(设定背景) 211
展示因果关系(旅程) 211
从因果到行动(决议) 213

第8章 ? 概率论精要 218
概述 218
总体和样本 219
样本偏差与随机样本 220
大数定律 222
大数定律的可视化 223
中心极限定理 227
平均数的抽样分布随着n 的增加而接近正态分布 228
和的抽样分布是正态的 230
从正态分布中抽取时的观测数量 231
中心极限定理的一个有用性质 232
从不同的分布中抽样 233
标准正态分布 239
标准正态分布与临界z 分数 242

第9章 ? 置信区间与假设检验 250
概述 250
大样本的置信区间 251
求总体比例 251
求总体平均数 256
小样本与t- 分布 260
自由度 263
小样本的样本标准差 264
用小样本构建置信区间 269
例子:女性薪酬与男性薪酬 270
比较两个样本的平均数 272
例子:两个群体和两种收入 273
例子:种族和对警察的看法 275
例子:收入和对特朗普的支持 275
置信水平 277
关于统计推断和因果关系的简要说明 280

第10章 ? 进行比较 285
概述 285
为什么要进行比较 286
需要比较的问题 287
比较两个分类变量 289
例子:对警察的看法 289
例子:哪些人去教堂 292
比较连续变量和分类变量 294
例子:奥巴马情感量表 294
比较两个连续变量 297
例子:性别与教育 297
例子:性别与政策制定 298
探索性数据分析:调查美国的堕胎率 301
重述要点 303
好的分析引出新的问题 308

第11章 ? 受控比较 312
概述 312
什么是受控比较 313
比较两个分类变量,同时控制第三个变量 314
例子:对警察的看法 314
例子:对移民的看法 320
比较两个连续变量,同时控制第三个变量 327
例子:婴儿死亡率 328
例子:凶杀率 331
论点与受控比较 334

第12章 ? 线性回归 340
概述 340
线性回归的优点 341
线性回归中的斜率和截距 342
对斜率和截距的解读 343
例子:选民投票率和教育 343
拟合优度(R2 统计量) 348
统计显著性 352
计算t- 比率 353
二元回归的例子 355
一个州的宗教信仰水平是否会影响堕胎率 356
宗教信仰是否会影响枪支法案 358
暴力会导致政治不稳定吗 359
收入(人均 GDP)与投票率有关吗 361

第13章 ? 多元回归 368
概述 368
什么是多元回归 369
为什么要使用多元回归 370
回归模型和论点 371
回归模型、理论和证据 372
解读多元回归中的估计值 376
实质显著性 376
统计显著性 377
拟合优度:R2 378
例子:凶杀率与教育 379
理论 379
描述数据 380
估计 384
经验蕴涵 386
讨论 389

第14章 ? 虚拟变量和交互作用 394
概述 394
什么是虚拟变量 395
加性模型与交互作用模型 396
二元虚拟变量回归 397
多元回归与虚拟变量 398
多元回归中的交互作用 398
例子:伯尼· 桑德斯,教育和收入 400
例子:外援,人均GDP 和民主 405

第15章 ? 诊断1 :普通最小二乘法是否适用 412
概述 412
回归分析中的诊断 413
统计量与估计量的性质 414
高斯- 马尔可夫假设 419
残差图 425

第16章 ? 诊断2 :残差、杠杆值与影响力的度量 438
概述 438
离群值 439
杠杆值 442
影响力的度量 448
库克距离 448
dfbeta 449
增加变量图 454

第17章 ? 逻辑回归 461
概述 461
需要逻辑回归解决的议题与难题 462
逻辑回归违反了高斯- 马尔可夫假设 463
使用对数发生比 466
使用预测概率 469
二元逻辑回归 469
多元逻辑回归 471
例子:2012 年奥巴马赢得的选举人团 472
逻辑回归模型拟合 475
例子:奥巴马,收入和教育 475
接收者操作特征曲线和曲线下面积 476

附录A ? 形成经验蕴涵 488
內容試閱
前言
本书旨在鼓励、启发和激发学生对社会科学数据分析的兴趣。其根本前提是学生通过做数据分析来学数据分析。为此,本书从简单的图形工具开始,探索数据并对数据提出有意义的问题。重点是用于发现深埋于回归表整洁外表之下的问题的那些方法。最后,读者会熟悉基本的数据分析技术,并形成数据分析方法,理解所做出的概念、分析乃至哲学的选择。在我看来,一个重要的目标是激发读者对所做事情的兴趣。本书的案例旨在让我们用真实的数据来面对现实世界的议题和问题。数据下载完成后,确保在开始前执行installD() 和libraries() 指令,第一个指令安装所有需要用到的包,而第二个指令加载这些包。installD() 指令只需要执行一次;libraries() 指令需要在每次重新启动R 后都执行。
本书为谁而写
本书面向多种读者,但主要还是为初学者准备的。本书假设读者事先没有统计学或微积分的相关知识,而扎实的统计学或微积分背景并不会使这些练习毫无收获。本书源于我在科罗拉多大学教授的大型课程——“定量方法导论(Introduction toQuantitative Methods)”。这是政治学专业学生的必修课,学生需要阅读、理解并审慎地考察越来越多的定量证据。我们真诚地希望在课堂上用一套技能武装学生,帮助他们解决问题。
数据分析师使用R 就像生物学家使用电子显微镜一样,这种面向对象的统计语言已经被广泛使用,主要是在数据科学家中间站稳了脚跟。虽然从教学的角度来讲,用纸笔学习统计学令人赞赏且有好处,但在这个大数据时代,学生必须掌握最先进的工具。本书充分为读者考虑,读者可下载配套数据并跟着一起做。这套代码根据我的经验提供了一组优秀的指令,初级、中级和高级的分析师都能用上。
对于那些经验更丰富的读者来说,本书提出了一种方法,强调简单的分析如何通过描述、理论和证据之间的来回往复迭代产生更好的议题。本书鼓励提出假设,查看证据,然后由这些证据产生新的假设。在我看来,为了提出下一个议题而构建假设时,读者就会展现出对案例的深刻理解。比起学习代码,比起理解概率论,本书设法形成一个永无止境的发现循环,体现为描述我们之所见,提出假设,根据经验检验它,然后产生下一个议题或假设。从这个意义上讲,即使是技术能力较高的读者,也能从中受益。
组织
大多数统计学教材都是从概率论的基础知识开始的,然后是抽样和假设检验,最后是相关性和回归分析。虽然概念上是连贯的,但学生首先要在学期之初克服对概率论的恐惧,必须解读标准正态分布表或t-分布表,然后在最后两周掌握二元或多元回归分析。这里存在两种思想流派,本书兼顾两者。一些人坚持认为,支撑回归理论的概率基础必须出现在首条数据拟合线之前。另一些人喜欢一开始就拟合曲线,构建模型。他们认为,学生只有在面对构建模型、生成估计以及评估模型拟合的挑战之后,才会有强烈的动机去理解用于生成t-比率、R2 统计量和置信区间的概率机制。
本书的设计是:在描述数据和进行比较之后,可以跳过第8章和第9章,直接进行回
归分析。关于诊断的章节,为支撑线性回归的高斯- 马尔可夫假设提供了直观的感受。还有一章专门介绍数据的展示(第7章)。如何向受众展示发现,往往连这样最基本的原则我们都不肯花时间。我将爱德华·塔夫特(Edward Tufte)的开创性工作与一些侧重于叙事过程的资料结合起来。
在掌握了多元回归分析的机制后,本书以逻辑回归作为结束——社会科学中的许多问题都涉及二元选择(是否投票)、所处的二元状态(是否大学毕业)以及二元环境(是否住在某个城市)。鉴于社会科学中这些问题的重要性和普遍性,本书会向学生介绍逻辑回归,如何分析以及报告其结果。
基本理念
在学术生涯的早期,我受到了我非常敬重的两位资深学者之间的争论的影响。我不记得主题了,但那是在两位教授的研究生研讨会上。当我们着手评估和审查一篇指定的文章时,其中一位教授显然介意其缺乏理论的严谨性。论文的论点似乎在随着每个新证据的出现而改变。面对论文中一个相当明显的事后推理的实例,两位教授开始争论这篇文章到底有没有做出什么贡献。虽然两人关系很好,但争论非常激烈,当其中一人强调“我不相信为了符合事实而不断改变理论的工作!”的时候,争论达到了顶点。我们等待着回应,房间里变得鸦雀无声。沉默片刻后,另一位教授笑着反讽道:“我不相信为了符合理论而不断改变事实的工作!”
正是如此。那天,关于如何打磨我的技艺,我的脑海中画出了清晰的线路。意识到“事实”从来都不是独立于我们的理解、背景和生活经历之外的,对我而言,这比用来解释它们的理论更为坚实。
话虽如此,我们还是得从某个地方开始,在我看来,最好的数据集是用有意义的、强效且重要的理论和问题构建的。因此,就像警察队长(《龙虎少年队》中由艾斯·库伯饰演)告诫下属(查宁·塔图姆和乔纳·希尔饰演)先打入毒品贩内部,然后找出供货商一样,本书鼓励学生先提出一个假设,然后根据经验去检验它。最后,关于社会科学是一种推演过程还是数据挖掘工作,本书不参与这场论战(毕竟,查宁·塔图姆确实问过他的队长,他们能否直接先找到供货商)。介于推演过程和数据挖掘工作之间,我希望能证明最好的实证研究有赖于二者之间开诚布公的讨论。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.