新書推薦:
《
欲望与家庭小说
》
售價:HK$
101.2
《
惜华年(全两册)
》
售價:HK$
72.2
《
甲骨文丛书·古代中国的军事文化
》
售價:HK$
99.7
《
中国王朝内争实录(套装全4册):从未见过的王朝内争编著史
》
售價:HK$
250.7
《
半导体纳米器件:物理、技术和应用
》
售價:HK$
181.7
《
创客精选项目设计与制作 第2版 刘笑笑 颜志勇 严国陶
》
售價:HK$
63.3
《
佛山华家班粤菜传承 华家班59位大厨 102道粤菜 图文并茂 菜式制作视频 粤菜故事技法 佛山传统文化 广东科技
》
售價:HK$
227.7
《
武人琴音(十周年纪念版 逝去的武林系列收官之作 形意拳一门三代:尚云祥、韩伯言、韩瑜的人生故事 凸显百年武人命运)
》
售價:HK$
44.9
|
編輯推薦: |
《领悟统计》对社会科学定量研究的工作方式进行了不同寻常的新解读。马丁提醒读者:定量研究的核心技艺,并不在于使参数估计变得精准,而在于透过严谨的数据分析来对各种有关社会过程的理论判断进行裁决。
研究者必须真正地去关心和思考数据背后的社会实体到底是什么,实际的社会过程究竟如何发生,而不是停留在变量层面来理解社会问题。
书中有很多巧妙的模拟演示和幽默的要点归纳,用以帮助读者理解那些隐藏在统计程序背后的基本逻辑,展现数据分析中常见的陷阱与难点。
书中有许多需要在研究实践中经历诸多艰苦的试错才能获得的宝贵启示,并以简洁清晰的方式呈现。
本书的思想与内容是深刻的,但行文上保持了作者一贯的轻松风格。打开书,你一定会惊喜地发现,这一智识之旅是充满乐趣的。
|
內容簡介: |
统计学的书已经够多了,为何还要再来一本?更何况,作者还不是统计学家!
统计学家很友善,统计学很有趣,但是他们想解决的难题和你想解决的难题不是一码事。事实上,我们将在本书中看到,很多时候,他们针对他们的难题而提出的解决方案,往往会使你的难题变得更加不可解决。
为什么会这样?因为统计学家的任务是确定参数估计与总体推断过程中的难题,然后尽可能解决。他们可以保证给你一个最佳的答案,但前提是你必须已经知道正确的模型。但是,在社会学里(以及多数社会科学里),我们并不知道正确的模型——我们并未完全掌握这个世界中发生的各种过程。如果有一天我们已经完全掌握了正确的模型,需要做的仅仅是确定数值估计,那我当然求之不得。但是,我们用统计数据分析想要做的,恰恰是要知道应该相信哪个模型。这与统计学家的任务是两码事,而我这本书要处理的就是这个任务。
现实难题的要害是:我们根本不知道真实的模型(true model)是什么,而不是我们不知道如何以最佳方式来拟合真实的模型;因此,在“统计学”课上学到的多数东西解决不了我们面对的上述难题。本书正是要直面这些难题。
|
關於作者: |
约翰·李维·马丁(John Levi Martin)
芝加哥大学社会学教授。研究领域涉及文化社会学、政治社会学、社会心理学、社会学理论。著有《社会结构》(2009)、《社会行动的解释》(2011)、《领悟理论》(2015)、《领悟方法》(2017)、《领悟统计》(2018)。
译者简介
高勇
中国政法大学社会学院教授。研究领域涉及社会学研究方法、组织社会学、发展社会学。著有《结构与变迁:转型过程中的生活机遇与认同意识》(2016)等,译有《领悟方法》《领悟统计》等。
|
目錄:
|
第1章 导 言 ………………………………………………………1
统计学与社会科学 …………………………………………………1
实用主义的看法 …………………………………………………12
尾声:为数理社会学而呼吁 ………………………………………36
第2章 熟悉数据 ……………………………………………………41
看我们找到了什么? ……………………………………………41
物化与唯名论 ……………………………………………………52
多了解来源 ………………………………………………………66
描述数据 …………………………………………………………76
数据落在哪里 ……………………………………………………86
结 论 ……………………………………………………………101
第3章 选择性问题 ………………………………………………103
选择性 ……………………………………………………………103
现实中的因果关系 ………………………………………………106
现实中的选择行动 ………………………………………………112
如何进行想象 ……………………………………………………124
结 论 ……………………………………………………………136
尾声:因果关系与线性模型 ……………………………………138
第4章 控制与误设 ………………………………………………141
混沌与控制 ………………………………………………………141
错误的用法 ………………………………………………………148
控制与误差 ………………………………………………………155
模型设定:交互作用 ……………………………………………165
用交互作用来碰运气 ……………………………………………169
结论:明智地行动 ………………………………………………179
附录4-A …………………………………………………………181
第5章 变异落在哪里 ……………………………………………183
了解变异模式 ……………………………………………………183
沿着各种维度来看 ………………………………………………195
固定效应与随机效应 ……………………………………………204
跨层面推断 ………………………………………………………214
结 论 ……………………………………………………………220
附录5-A …………………………………………………………220
第6章 机会来敲门 ………………………………………………227
维度问题与除法 …………………………………………………227
比值变量的其他复杂之处 ………………………………………244
厘清条件 …………………………………………………………255
关系与风险暴露 …………………………………………………259
结 论 ……………………………………………………………270
附录6-A …………………………………………………………272
附录6-B …………………………………………………………273
附录6-C …………………………………………………………274
第7章 时间与空间 ………………………………………………279
导 言 ……………………………………………………………279
纵贯分析 …………………………………………………………281
空间就是地点 ……………………………………………………304
结 论 ……………………………………………………………329
第8章 当世界对过程的了解比你多时 …………………………331
从无知中提炼“知识”……………………………………………332
家庭出身 …………………………………………………………335
社会网络知道的东西 ……………………………………………342
利用人际网络来抽样 ……………………………………………362
互 依 ……………………………………………………………368
结 论 ……………………………………………………………397
第9章 好得让人生疑 ……………………………………………399
概 述 ……………………………………………………………399
“这么想想是不错的”……………………………………………401
定性比较分析:像统计而非统计 ………………………………413
模 拟 ……………………………………………………………436
总结一下 …………………………………………………………456
结 语 ………………………………………………………………459
统计伦理 …………………………………………………………463
最后的提醒 ………………………………………………………467
译后记 ………………………………………………………………469
|
內容試閱:
|
统计学的局限
统计学中的大多数内容都与我们社会学家不相干。我们需要的,是能够帮助我们在关于社会世界的各种不同见解之间进行裁决(adjudicate)的方法。对于这一任务来说,只有在极少数情况下,把某一个模型(或某一组模型)的估计变得更加精准是重要的;在多数情况下,那都无关紧要。这就好比说,医学投入大量资源(以及大量的猴子和兔子)来研究如何让人长生不老,而这明明是办不到的事。研究者把精力都投到这种根本办不到的事情上,却忽略了更加重要的现实问题。为什么会这样?这可能是因为研究“如何让一个九十九岁的富翁精神矍铄”更加有利可图,也可能是因为这里确实有很多有趣的生物医学问题。但是,如果你看看周遭的现实世界(而不是所谓的“有效需求”),就会知道现实中最主要的医学问题其实很简单,就是营养、锻炼、环境风险这些我们已经熟知的东西。但是,这些看似简单的问题在实践中要做得到却很困难。相比之下,试着找些灵丹妙药来让人起死回生,确实要好玩得多。
统计工作也是如此。统计学科要研究的,几乎都是如何获取真实模型中参数的最佳估计(我戏称之为“佳偶估计”)。统计学家坦承,他们的工作范围只是如下内容:在你已经知道了应该使用什么模型这一最重要的内容之后,他们来想办法准确地估计参数②。遗憾的是,我们费心去做统计,通常就是因为我们不知道正确的模型是什么样的。现实难题并不是真实模型给定时如何获取参数的最佳估计,而是如何避免被模型结果误导而相信了错误的模型。我们对社会世界提出种种见解,然后让现实世界来提醒我们是否犯错了——更多的是在我们确实犯错了的时候发出这种提醒。
我们如何做到这一点呢?我想用木匠手艺来打个比方。从数据中获取真相其实是一门需要学习的手艺。手艺的要诀之一恰恰是要知道什么时候不能太花哨。在教别人如何制作椅子的时候,你不能让他锯好木头块后,直接用 280 号的特细砂纸来打磨。你得告诉他先用锉子,然后用80号砂纸,之后再用120号,再用180号,再用220 号,这样循序渐进最终成形。可是,多数统计学教材教你的,都是一下子就给你一堆 280号的特细砂纸。如果你的零件已经精准到位,那你就不用往下看了。如果在你面前还只有一堆木头,那就请继续往下读。
很多读者会提出异议,说统计学的最新进展已经不再需要给定真实的模型。事实上,有很多有趣的研究已经探讨了如何对多组模型进行分析,有一些甚至不需要有真实模型存在于你考察的集合当中(Burnham and Anderson,2004:276)。有一些方法可以从模型集中选出一个最佳模型,还有一些方法提出了跨模型的更优参数估计,另一些方法则基于模型的不确定性来更好地估计参数的不确定性。在社会学中,有从贝叶斯统计学的角度对此进行的阐发,也有从信息论的角度进行的阐发。贝叶斯理念的出发点是,我们要考察的是一组模型,然后比较在看数据之前和之后得到的先验概率分布和后验概率分布。
我和其他人一样,一直热衷于这些方法(参看 Raftery,1985;Western,1996)。但是,即便采用这些方法,我们也只能够考察所有可能模型中的极小一部分①。在进行模型选择或模型平均(model averaging)时,通常要考察的也只是一组固定的变量(数目接近于10这一级别而非100这一级别)的某些可能组合形式。我们通常还会设定模型的统计分布,比如说在广义线性模型中设定连接函数和误差分布的形式。
上述这些方法很重要。随着计算机提供的便利日益增加,人们会越来越多地对于各种模型进行详尽的搜索。我相信,未来人们会逐渐把这些方法视为“标准的做法”。我们甚至可以跳出贝叶斯框架,来考察方法在其他方面的稳健性。例如,在最近发表的一篇精彩论文中,弗兰克等人(Frank et al.,2013)对某些变量取值排列出了所有可能的合并方式,然后与自己偏好的模型进行比较,以便从中选出最佳模型。但是,它并未解决我们的基本难题,我们甚至无法确定自己是否接近了真实模型。
你可能会认为,采用那些统计学家开发出来的更精准的模型参数估计方法,这即便解决不了我们的最大难题,但是至少不会有什么坏处。如果我们的模型接近真实,那么这会让估计量更精准;如果我们的模型并不真实,至少这也不会有坏影响。但是在很多情况下(虽然并不必然),对于完美模型来说最优的估计方法,对于错误模型来说却是较差的估计方法。
在我上研究生的时候,普通最小二乘(Ordinary Least Square,以下简称“OLS”)回归广受抨击。我们认为,它几乎在任何情况下都不适用。只有那些没脑子的人才会用这种方法,聪明人则会对线性模型唯恐避之不及。我们喜欢列出回归分析的那些假定,由此(自以为)表明了回归的结果有多么不靠谱。
我以前有两辆摩托车。一辆是特别酷炫的、排量达850cc的、平行双引擎的诺顿突击队(Norton Commando),这是最后一款脚踏启动、带大号英国双引擎的诺顿摩托车,发动机、传动链、变速箱都是分离的,轰鸣声就像音乐一样动听。另一辆是平淡无奇、规规矩矩的本田CB 400 T2,它最大的特点就是没有特点。
我对那辆诺顿摩托车了如指掌:我把它完全拆开来换零件;我细致研究过那些密密麻麻的零件图,只是为了搞清楚需要何种稀奇古怪的扳手来扭动一个小零件。我有这么一辆古董摩托车,可是我妻子从来没有担忧过我的安全问题,虽说当时我家里还有小孩子。曾经发生过的最大一次事故,是我被突出来的一个螺丝蹭破了手指。因为它基本上只待在车库里。我只是在车库里不断摆弄它,弄得满地油污。相比之下,那辆本田乏味之至。你按下按钮,它就启动;你挂挡,它就前进;你到地方了,就关了它。需要在别人面前炫一下时,我会开那辆诺顿;但是需要实际办事时,我就开那辆本田。OLS回归和本田摩托车好有一比:你看不上它,不欣赏它,可实际办事的时候老得靠它。
|
|