新書推薦:
《
甲骨文丛书·剑桥世界暴力史(第一卷):史前和古代世界(套装全2册)
》
售價:HK$
210.6
《
甲骨文丛书·中华早期帝国:秦汉史的重估
》
售價:HK$
300.2
《
欲望与家庭小说
》
售價:HK$
98.6
《
惜华年(全两册)
》
售價:HK$
70.3
《
甲骨文丛书·古代中国的军事文化
》
售價:HK$
99.7
《
中国王朝内争实录(套装全4册):从未见过的王朝内争编著史
》
售價:HK$
244.2
《
半导体纳米器件:物理、技术和应用
》
售價:HK$
177.0
《
创客精选项目设计与制作 第2版 刘笑笑 颜志勇 严国陶
》
售價:HK$
61.6
|
編輯推薦: |
本书以《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》为背景,旨在从概念和技术的角度对数据隐私与数据治理进行系统概述。第一篇从历史与系统的角度介绍数据隐私与数据治理的基础,第二到四篇分别侧重大规模数据收集、机器学习,以及数据治理中的隐私问题,介绍其相应的技术基础,总结当下的关键问题与技术方案。本书从全新的数据生态的角度介绍数据隐私与数据治理,在内容介绍上,以技术与算法的讲解为主,辅以案例,详略得当。本书既可以供技术人员查阅,亦可以供感兴趣的普通用户阅读,建立对数据隐私与数据治理的基本认识,培养数据素养。
|
內容簡介: |
本书以《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》为背景,旨在从概念和技术的角度对数据隐私与数据治理进行系统概述。首篇从历史与系统的角度介绍数据隐私与数据治理的基础,后三篇分别侧重大规模数据收集、机器学习,以及数据治理中的隐私问题,介绍其相应的技术基础,总结当下的关键问题与技术方案。本书从全新的数据生态的角度介绍数据隐私与数据治理,在内容介绍上,以技术与算法的讲解为主,辅以案例,详略得当。
|
目錄:
|
前言
第一篇基础知识
第1章绪论2
11数据隐私的产生2
111社会发展视角下的隐私3
112数据发展视角下的隐私6
12数据隐私技术7
121模糊技术7
122扰动技术8
123加密技术9
124混合隐私技术10
125分布式计算框架11
126区块链技术12
127技术的比较12
13数据隐私面临的挑战13
131大数据隐私挑战13
132人工智能隐私挑战15
133数据治理挑战16
14小结18
参考文献19
第2章数据隐私的概念21
21引言21
22数据隐私的定义与特征22
221数据隐私的定义22
222数据隐私的基本特征22
223数据隐私和信息安全的区别22
23数据隐私的分类24
231数据隐私的构成要素24
232显式隐私与隐式隐私24
233数据隐私保护场景26
24数据隐私的框架29
241隐私风险监测31
242隐私风险评估31
243隐私主动管理32
244隐私溯源问责32
245法律法规保障33
25小结34
参考文献34
第3章数据治理的概念36
31引言36
32数据治理的体系38
33数据治理的法律法规39
34数据治理的实践42
35小结43
参考文献43
第二篇大数据隐私保护技术
第4章差分隐私方法46
41基础知识46
411基本定义47
412基础性质48
413常用扰动机制50
414应用场景53
42面向数据发布的隐私保护53
421直方图数据发布54
422划分发布58
43面向数据分析的隐私保护61
431分类分析61
432频繁模式挖掘62
433回归分析63
44小结65
参考文献65
第5章本地化差分隐私方法68
51基础知识69
511基本定义69
512基础性质70
513常用扰动机制71
514应用场景72
52基于简单数据集的隐私保护74
521频率统计74
522均值统计75
53基于复杂数据集的隐私保护77
531键值对数据的收集与发布78
532图数据的收集与发布81
533时序数据的收集与发布84
54小结86
参考文献87
第6章差分隐私与实用性89
61引言90
62隐私放大理论与方法91
621基于二次采样的隐私放大方法91
622基于混洗的隐私放大方法93
623其他隐私放大方法95
63差分隐私与密码学方法的结合95
631密码学方法改进差分隐私效用95
632差分隐私改进密码学协议效率100
64一种隐私实用化框架103
641ESA框架与定义103
642ESA中的隐私放大107
643混洗差分隐私方法108
65小结111
参考文献111
第三篇人工智能隐私保护技术
第7章机器学习中的隐私保护116
71引言117
72机器学习的隐私保护119
721同态加密119
722差分隐私119
73统计学习的隐私保护120
74深度学习的隐私保护124
741隐私算法设计124
742隐私风险分析125
75小结127
参考文献127
第8章联邦学习中的隐私保护129
81引言129
82隐私保护的联邦学习架构133
83基于差分隐私的联邦学习135
84基于安全聚合的联邦学习136
85个性化隐私保护与联邦学习138
851个性化隐私保护139
852个性化隐私保护的联邦学习141
86小结142
参考文献142
第四篇数据生态与数据治理
第9章数据要素市场146
91引言146
92数据交易148
921免费交易框架148
922付费交易框架149
923模型交易框架150
93数据流通152
94小结154
参考文献154
第10章数据垄断155
101引言155
102数据垄断现状157
1021定义与概念157
1022总体状况158
1023详情分析159
103数据垄断的成因与危害160
1031垄断成因160
1032垄断危害161
104数据垄断治理模式162
1041局部模式162
1042中介模式163
1043全局模式164
105小结165
参考文献165
第11章数据公平166
111引言166
112对公平的理解167
113公平计算方法168
1131蛋糕分割问题168
1132价格歧视问题169
1133算法偏见问题170
1134数据偏见问题171
114小结172
参考文献172
第12章数据透明174
121引言174
122数据透明的概念175
123数据透明框架176
124基于区块链的数据透明方案178
1241数据获取与共享透明179
1242数据云存储服务透明181
1243数据决策透明183
125小结184
|
內容試閱:
|
前言
2021年可以说是数据隐私与数据治理元年。社会各界都在觉醒,并探讨其规范与解决方案,这与2006年我开始关注这个问题时的社会环境大不相同!
在数据隐私方面,《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》相继出台,全面、多领域构筑了我国信息与数据安全的法律保障,隐私问题不再是模糊不清的法外之地。在数据治理方面,《“十四五”数字经济发展规划》《互联网信息服务算法推荐管理规定》分别关注了数据与算法中的治理问题。而继《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》提出将数据纳入生产要素后,中共中央网络安全和信息化委员会办公室更是在《“十四五”国家信息化规划》中进一步提出“加强数据治理”。
紧随国家的战略导向,企业也在不断尝试。在数据隐私方面,小米等手机厂商突破性地在系统中内置拦截网和隐匿面具等隐私功能,为用户隐私保驾护航。
如何将数据隐私与数据治理从法律文字落到实际应用仍不明晰,诸多问题依赖“行业自律”,而大多数企业仅聚焦于“合规”问题。社会各界都翘首以盼一套系统讲述数据隐私与数据治理概念和技术的读本!这正是本书关注的重点,以期对当下数据要素驱动下的数字经济所面临的数据挑战给出基本的应对之策。
本书由笔者的团队依据多年的研究编写而成,旨在从概念和技术的角度对数据隐私与数据治理进行系统阐述,为学术研究机构、政府部门、企业等梳理数据隐私与数据治理的知识体系提供入口,为提高全民的数据素养提供辅导材料。同时,要厘清问题,解决问题,需要从提升大家的“数据素养”着手。数据素养未来可能是科学素养的重要组成部分,而数据素养首要的任务就是让大家具备对数据与隐私的认识和处置能力。这也是促使我们编写此书的直接动力!
本书从四个方面对数据隐私与数据治理进行了深入浅出的论述。
第一篇“基础知识”,主要阐述数据隐私与治理的基础概念与方法体系。该篇基于对数据发展主线的认识,揭示数据隐私和治理产生的根源,并结合当下应用现状概述隐私的构成要素、管理框架、治理体系和治理实践。其核心要点是针对数据要素和数字经济,提出数据隐私要由被动保护变为主动防护,数据治理要由大数据全生命周期治理转变为后大数据时代的数据生态治理,更好地服务数字经济的发展。该篇内容尽可能减少晦涩的专业定理与描述,从多角度讲解数据隐私与数据治理,既可以帮助相关专业的技术人员建立完善的隐私保护与数据治理体系,也可以供普通用户阅读以增加认知。
第二篇“大数据隐私保护技术”,主要阐述面向共享与发布的隐私保护技术。该篇重点介绍当下主流的隐私保护技术,包括云平台场景下中心化的差分隐私技术,边缘计算场景下本地化的差分隐私技术,以及为提高数据可用性的隐私放大理论、差分隐私与密码学相结合的混合方法等。该篇内容较为专业翔实,具备前沿性,主要面向该方向的专业人员。
第三篇“人工智能隐私保护技术”,主要阐述面向机器学习模型的隐私保护技术。该篇重点介绍集中式机器学习和联邦学习两种场景下的隐私方法设计,包括机器学习中存在的因数据非法窃取导致的直接隐私泄露问题和因外部隐私攻击导致的间接隐私泄露问题,以及为提高模型可用性的个性化差分隐私方法。该篇内容与机器学习密切相关,具备前沿性,主要面向该方向的专业人员。
第四篇“数据生态与数据治理”,主要阐述面向数据市场和数据生态的治理技术。该篇基于数据要素的发展理念,重点介绍数据市场中数据交易与数据流通治理体系,以及数据生态中数据垄断、算法公平的治理方法。其核心要点是要建立数据透明的治理体系,实现对数据全链条、透明化的监督治理,做到治理的事前预警、事中防护、事后溯源,为数字经济的发展保驾护航。该篇内容从全新的视角介绍数据作为生产要素在市场流通中会产生的诸多问题,探讨其可能的解决方案,可供相关领域的专业人员、政务人员,以及普通用户阅读,帮助他们全面认识数据治理。
总之,本书梳理了数据隐私与数据治理的基本解决之道,并打破传统的认知体系,实现观念、技术、架构的转变,即观念上从数据生命周期观到数据生态观的转变、技术上从隐私保护到隐私防护(管理)的转变和架构上从溯源问责到数据透明的转变,才能跟上形势,从而保证数据要素在市场中发挥关键作用。希望本书为教育机构的人才培养和政府部门的管理提供有价值的参考资料,促进我国数字经济的发展。
该书构思于2020年年初,笔者与团队中的王雷霞、刘俊旭、范卓娅、叶青青、刘立新和李梓童一起,历经数次编撰、修改,形成了当前的版本。笔者团队尽可能将本书中所涉及的内容描述得清晰易懂,如有疑惑,可联系笔者团队进行交流。希望大家都能从本书中有所收获,能更加清晰地看到生活中无处不在的隐私问题,亦能有所行动!
孟小峰
中国人民大学
2023年1月1日
|
|