登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書

『簡體書』数据可视化分析(第2版):分析原理和Tableau、SQL实践(全彩)

書城自編碼: 3906715
分類:簡體書→大陸圖書→計算機/網絡數據庫
作者: 喜乐君
國際書號(ISBN): 9787121461729
出版社: 电子工业出版社
出版日期: 2023-09-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 228.7

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
唐长安城坊古今注
《 唐长安城坊古今注 》

售價:HK$ 112.7
持家的人 : 女性劳动与能源变革
《 持家的人 : 女性劳动与能源变革 》

售價:HK$ 71.3
教育心理学
《 教育心理学 》

售價:HK$ 182.9
中亚古代史
《 中亚古代史 》

售價:HK$ 102.4
村上春树·音乐
《 村上春树·音乐 》

售價:HK$ 67.9
金钱、道德和做派:法国和美国中上阶层的文化
《 金钱、道德和做派:法国和美国中上阶层的文化 》

售價:HK$ 101.2
大明律(中华经典名著全本全注全译丛书-三全本)
《 大明律(中华经典名著全本全注全译丛书-三全本) 》

售價:HK$ 57.5
广州:向海而生的商业之都
《 广州:向海而生的商业之都 》

售價:HK$ 89.7

 

建議一齊購買:

+

HK$ 107.7
《像程序员一样使用MySQL》
+

HK$ 156.1
《可视化指南:数据分析与数据交互》
+

HK$ 60.3
《Spark分布式处理实战》
編輯推薦:
以Tableau Desktop的应用为中心,借工具讲解原理,以原理深化工具应用
由点及面地介绍了业务分析的思考和原理
提出了实践性的“业务—数据—分析”层次框架
以三类“详细级别”的概念贯通数据模型、高级筛选和高级计算三大主题
內容簡介:
本书以敏捷分析工具Tableau为基础,部分章节辅以SQL讲解,系统介绍了数据可视化分析的体系和方法,内容涵盖问题分析方法、数据合并和建模、可视化图形的选择和构建、多种交互方式及其组合、仪表板设计与高级交互、基本计算和高级计算等。
本书以Tableau Desktop的应用为中心,借工具讲解原理,以原理深化工具应用,并由点及面地介绍了业务分析的思考和原理,特别是提出了实践性的”业务—数据—分析”层次框架,并以三类”详细级别”的概念贯通数据模型、高级筛选和高级计算三大主题。
本书重点介绍工具应用背后的思考方式和原理,帮助读者建立\详细级别”的思考框架,举一反三,从而实现多维、结构化分析。
關於作者:
喜乐君Tableau Visionary(2020—2023)、数据分析咨询顾问、培训讲师·敏捷BI“布道师”。连续创业者、上海唯知唯识创始人。
山东大学法学学士、教育学硕士,首届“硕士研究生国家奖学金”获得者。
站在业务角度、深入行业一线,借Tableau洞悉敏捷分析,重新理解和诠释“业务数据分析”。
目錄
内容及说明 XVIII
第1篇 奠基:数字化转型与业务分析原理
第1章 数字化转型:21世纪的机遇与挑战 2
1.1 理解数据的层次及分析的价值 2
1.2 数据应用的3个阶段 4
1.2.1 初级·报表展现:信息的整理与固定展现 5
1.2.2 中级·业务分析:分析辅助决策,决策创造价值 7
1.2.3 终极·智能商业:大数据重塑商业模式 8
1.3 数字化转型到底“转”什么 10
1.3.1 塑造实事求是的数据文化:一切用数据说话 10
1.3.2 数字化转型源自各个业务场景的数字化和持续进化 12
1.3.3 业务和技术兼备的卓越中心和分析型人才 13
1.3.4 统一并持续优化分析方法论,提高分析效率和准确性 15
参考资料 18
第2章 “业务—数据—分析”体系与企业数据地图 19
2.1 “业务—数据—分析”体系:BDA分析框架 19
2.1.1 分析层:指标体系建设和分析仪表板 21
2.1.2 数据层:数据管理与数据仓库 22
2.1.3 业务层:业务流程与“业务在线化” 23
2.2 建立全局视角:企业数据地图 24
2.3 两种企业级分析推进路径:“自上而下”与“自下而上” 26
2.3.1 自下而上:从数据出发的分析之路 26
2.3.2 自上而下:从问题和指标出发的分析之路 27

2.4 可视化是大数据分析的桥梁和媒介 28
2.4.1 数字、文字的可视化及可视化要素 28
2.4.2 从可视化到抽象分析:走向仪表板和高级分析 30
2.5 Tableau:大数据敏捷业务分析的“代表作” 32
参考资料 34
第3章 业务可视化分析:关键概念与方法论 35
3.1 解析问题结构、理解聚合过程和指标 35
3.1.1 问题的结构及其相互关系 36
3.1.2 聚合是问题分析的本质 38
3.1.3 基于聚合的字段分类:维度描述问题,度量回答问题 40
3.1.4 指标是聚合度量的业务形态 41
3.2 明细表与聚合表:聚合的逻辑过程 42
3.2.1 业务明细表和问题聚合表:聚合的起点和终点 43
3.2.2 物理表与逻辑表:数据表的抽象类型 45
3.2.3 字段的数据类型:数据表字段的抽象类型 46
3.3 可视化图形:聚合交叉表的“另一面” 49
3.3.1 问题类型与可视化增强分析 50
3.3.2 可视化背后的数据类型:连续和离散 51
3.3.3 Tableau中的字段属性及其作用 55
3.4 简单问题的“三步走”方法和Tableau示例 56
3.5 聚合度和详细级别:构建复杂问题层次理论 58
3.5.1 数据明细表和聚合度:多个问题的基准点和衡量尺度 59
3.5.2 详细级别:不同“聚合度”问题对应的抽象依据 60
3.5.3 结构化分析的两个应用方向 62
3.5.4 关键概念汇总:聚合、聚合度、详细级别、颗粒度 64
参考资料 66
练习题目 66
第2篇 数据准备、可视化、交互设计
第4章 数据合并与关系模型(Tableau/SQL) 68
4.1 概论:数据合并与连接数据源 69
4.1.1 理解数据合并、数据模型的重要性 69
4.1.2 数据合并和数据模型的相关概念 71
4.2 数据合并的分类矩阵与数据模型案例 72
4.2.1 “所见即所得”的行级别数据合并:Union和Join 72
4.2.2 Excel的局限:基于数据透视表的数据合并 74
4.2.3 Tableau数据混合初探,在聚合后完成连接 76
4.2.4 数据合并分类矩阵:两种合并方法、两个合并位置 78
4.3 行级别并集、连接与Tableau/SQL方法 81
4.3.1 数据并集 81
4.3.2 数据连接:连接条件与连接方式 84
4.3.3 高级连接的形式:仅左侧连接、交叉连接与“自连接” 89
4.3.4 明细表并集与连接的异同点与局限性 93
4.4 从数据关系匹配到关系模型 96
4.4.1 “临时”数据关系:基于问题层次创建数据关系匹配 96
4.4.2 数据模型:在最详细且有业务意义的详细级别预先构建数据关系 98
4.4.3 【关键】层次分析方法:从数据合并到数据关系模型 100
4.4.4 【难点】关系模型优化(上):匹配类型(基数) 106
4.4.5 【难点】关系模型优化(下):匹配范围(引用完整性) 111
4.4.6 共享维度表:从雪花模型到网状模型 116
4.4.7 通往最佳实践:业务关系模型的可视化表达 117
4.4.8 案例:图书及销售的数据关系模型 118
4.5 重说数据混合:编辑匹配关系和匹配详细级别 120
4.5.1 数据混合设置:自定义混合条件和自定义匹配字段 121
4.5.2 高级数据混合:数据匹配详细级别不同于主视图 123
4.6 不同数据合并类型的相互影响 127
4.7 Tableau与SQL/Python的结合 128
4.7.1 Tableau和SQL的结合 128
4.7.2 SQL中的连接 129
4.7.3 Tableau Table Extension:给数据源插上“算法之翼”(Tableau 2022.3 版本) 132
参考资料 133
练习题目 133
第5章 可视化分析与探索 134
5.1 数据准备:理解业务过程与整理数据字段 134
5.1.1 数据表:理解业务过程及数据表详细级别 134
5.1.2 字段:理解业务过程的对象并做分组分类 136
5.2 从问题到可视化图形:如何确定主视图框架 138
5.2.1 从问题类型到主要的可视化图形 138
5.2.2 初级可视化:“三图一表” 139
5.2.3 中级可视化:分布分析、相关性分析 143
5.2.4 地理位置可视化 148
5.2.5 数据图像角色可视化(Tableau 2022.4 版本) 155
5.3 可视化绘制方法与可视化增强 156
5.3.1 像油画一样做可视化:可视化三步骤和标记的使用 156
5.3.2 度量双轴及其综合处理 158
5.3.3 多个坐标轴的“公共基准”:度量值 160
5.4 高级分析入门:参考线与参考区间 161
5.4.1 参考线的创建及其组合 161
5.4.2 标准甘特图和标靶图:条形图与参考线的两种结合方式 163
5.4.3 参考区间 166
5.4.4 置信区间模型 167
5.4.5 趋势线与预测线 168
5.4.6 群集 169
5.5 格式设置:必要调整,但不要过度 170
5.5.1 常见的设置格式工具栏 170
5.5.2 设置“标签”格式,自定义文本表 171
5.5.3 工具提示的格式设置、交互和“画中画” 172
5.5.4 其他常用小技巧 173
参考资料 175
练习题目 175
第6章 Tableau/SQL筛选与集操作 176
6.1 理解不同工具背后的筛选方法与共同点 176
6.1.1 筛选的两类位置:独立筛选和“条件计算” 176
6.1.2 使用不同工具完成“独立筛选” 177
6.2 筛选的分类方法:基于详细级别的视角 182
6.2.1 【入门】数据表行级别的筛选:维度筛选器 183
6.2.2 【进阶】指定详细级别的聚合筛选:简单条件和顶部筛选 186
6.2.3 【难点】指定详细级别聚合的筛选:建立在自定义计算之上 192
6.3 筛选范围的交互方法:快速筛选和参数控制 195
6.3.1 快速筛选器及其基本配置 195
6.3.2 特殊的日期筛选器:默认筛选到最新日期 196
6.3.3 参数控制:完全独立和依赖引用 197
6.4 多个筛选的处理:交集计算和优先级 199
6.4.1 多个筛选的基础知识:数据集及运算 199
6.4.2 多个筛选的计算原则(上):相同类型取交集 200
6.4.3 多个筛选的计算原则(下):不同类型按优先级计算交集 200
6.4.4 调整筛选器优先级(上):上下文筛选器和表计算筛选器 202
6.4.5 调整筛选器优先级(下):数据源筛选器和数据提取筛选器 204
6.4.6 筛选与计算的优先级 206
6.5 集(Set):把筛选保留下来的“神奇容器” 207
6.5.1 创建自定义集及集的本质 207
6.5.2 自定义集内成员:“集控制”(Tableau 2020.2 版本) 209
6.5.3 创建动态条件集 209
6.5.4 集动作:以视图交互方式更新集成员 211
6.6 集的运算、优先级和应用 212
6.6.1 多个集的合并与“合并集”运算 212
6.6.2 集和筛选的关系及优先级 215
6.6.3 集的高级应用:控制用户权限的“用户筛选器” 217
6.7 中级交互:仪表板中的快速筛选、集交互 218
6.7.1 交互设计的基本分类 218
6.7.2 “以图筛图”:仪表板中的多表快速关联筛选 218
6.7.3 共用筛选器、集和参数:典型的仪表板交互 220
6.7.4 工具提示“画中画”:最简单的多表关联 223
6.8 更多实用工具:分组、数据桶、分层结构、排序 224
6.8.1 作为数据准备的“组” 224
6.8.2 分层结构钻取分析与仅显示相关值 225
6.8.3 排序:对离散字段的数据值排序 226
参考资料 228
练习题目 228
第7章 仪表板设计、进阶与高级交互 230
7.1 仪表板:最重要的主题展现形式 230
7.1.1 仪表板设计的基本过程和常见功能 231
7.1.2 仪表板大小、布局和对象 233
7.1.3 常用的交互对象:隐藏按钮、导航按钮 237
7.1.4 仪表板布局中的分层结构 239
7.1.5 跨设备类型的仪表板适配 240
7.2 故事:以数据故事叙事、探索 241
7.2.1 故事及其基本设置 241
7.2.2 故事的阐述方式 242
7.3 仪表板进阶:指标、初始模板、性能优化与“数据指南” 243
7.3.1 指标:聚焦仪表板关键度量 244
7.3.2 初始模板:专家分析模板加速分析 246
7.3.3 发布工作簿和“工作簿优化器” 247
7.3.4 数据指南(Tableau 2022.3 版本) 251
7.4 三种基本交互类型:筛选、高亮和页面 252
7.4.1 突出显示:以聚焦实现间接筛选 253
7.4.2 页面轮播:快速筛选的连续叠加 255
7.5 两类高级交互工具:参数、集交互 257
7.5.1 关键原理:参数、集的共同点和差异 257
7.5.2 参数与逻辑判断结合:切换视图度量 260
7.5.3 动态参数:动态更新范围和初始值 262
7.5.4 集控制:以控件方式手动更新集成员 264
7.6 参数动作:参数、计算和交互(Tableau 2019.2 版本) 264
7.6.1 参数动作:使用动作更新度量值 265
7.6.2 动态筛选:参数动作和计算实现差异化筛选 266
7.6.3 动态基准分析:使用参数动作控制参考线和计算基准 268
7.6.4 自定义分层结构:使用参数展开指定的类别 270
7.7 高级交互:指定区域对象的动态可见性(Tableau 2022.3 版本) 272
7.8 高级互动的巅峰:集动作和集控制 275
7.8.1 经典集动作:交互更新自定义集(Tableau 2018.3 版本) 276
7.8.2 集的控制与更新:赋予集以强大的灵魂 278
7.8.3 使用集完成对比分析和标杆分析 279
7.8.4 高级互动的使用建议 282
练习题目 283
第3篇 以有限字段做无尽分析:Tableau、SQL函数和计算体系
第8章 计算的底层框架:行级别计算与聚合计算 286
8.1 计算的演进及分类:从Excel、SQL到Tableau 287
8.1.1 计算的本质及其与业务过程的关系 287
8.1.2 以Excel理解详细级别与计算的两大分类 288
8.1.3 从Excel“存取一体”到“数据库-SQL”的存取分离 292
8.1.4 集大成者Tableau:将查询、计算和展现融为一体 294
8.2 计算的两大分类:分析是聚合的抽象过程 297
8.2.1 行级别计算、聚合计算的差异和关系 297
8.2.2 从业务角度理解计算的结果:业务字段VS分析字段 300
8.3 数据准备类函数(上):字符串函数、日期函数 302
8.3.1 字符串函数:截取、查找替换等清理函数 302
8.3.2 日期函数:日期独特性与转换、计算 306
8.3.3 数据类型转换函数 315
8.4 数据准备类函数(下):正则表达式 316
8.5 分析函数:从明细到问题的“直接聚合” 318
8.5.1 描述规模:总和、计数、平均值 319
8.5.2 描述数据的波动程度:方差和标准差 320
8.5.3 关注个体,走向分布:百分位函数及最大值、最小值、中位数 322
8.5.4 ATTR属性——针对维度字段的聚合判断 324
8.6 通用型计算:算术函数和逻辑函数 325
8.6.1 算术运算、精度控制函数 325
8.6.2 逻辑表达式和逻辑判断符 329
8.7 行级别计算与聚合计算的区别与结合 332
8.7.1 案例:各子类别的利润与盈利结构分析 332
8.7.2 复习:行级别计算和聚合计算的差异 334
8.7.3 SUMIF条件聚合:将行级别筛选和聚合分析合二为一 335
8.8 专题:地理空间分析之“空间函数” 338
参考资料 345
练习题目 345
第9章 高级分析函数:Tableau表计算/ SQL窗口函数 346
9.1 合计的两个方法及“广义LOD表达式” 346
9.1.1 入门:从Excel理解“合计百分比”计算的层次关系 347
9.1.2 高级分析的层次框架:数据表详细级别和聚合度 348
9.1.3 进阶:“合计百分比”的两种SQL方法 349
9.1.4 Tableau敏捷BI,让业务用户轻松驾驭二次聚合分析 351
9.1.5 “广义LOD表达式”与计算的分类 354
9.2 “同/环比”偏移计算及表计算设置方法 356
9.2.1 维度作为偏移计算依据:单一维度的同比差异 356
9.2.2 包含多个维度的同比(上):区别范围和依据 358
9.2.3 包含多个维度的同比(下):设置多个依据 360
9.2.4 SQL窗口函数:偏移类窗口函数案例介绍 361
9.3 小结:表计算的独特性及两种设置方法 365
9.3.1 从差异计算的两种方法理解窗口计算的独特性 365
9.3.2 Tableau设置范围的两种方法:相对/绝对方法与适用场景 368
9.4 高级分析函数之排序计算:INDEX与RANK 369
9.4.1 Tableau/SQL排序与百分位排序 370
9.4.2 公共基准对比:不同时间的电影票房对比(TC2) 374
9.4.3 凹凸图:随日期变化的RANK函数(TC4) 376
9.5 最重要的二次聚合函数:WINDOW(窗口)函数 380
9.5.1 合计:最简单、常用的WINDOW(窗口)函数 381
9.5.2 累计聚合:RUNNING_SUM函数——累计汽车销量 383
9.5.3 移动聚合:移动窗口计算函数MOVING AVG 385
9.5.4 “大一统”:千变万化的窗口函数WINDOW 386
9.6 最常用的表计算:快速表计算及其附加计算 389
9.6.1 快速表计算:预置的常见表计算应用 390
9.6.2 快速表计算的嵌套:表计算的组合(TC3) 391
9.7 表计算应用(1):自定义参考线、“合计利润率” 393
9.7.1 聚合值参考线——表计算的“可视化形式” 393
9.7.2 “合计利润率”:理解参考线对应的表计算 394
9.7.3 【难点】理解TOTAL(合计)与WINDOW_SUM(汇总)的差异 396
9.7.4 自定义参考线及其计算:箱线图松散化与散点图颜色矩阵 398
9.8 表计算应用(2):标杆分析——多种类型的计算组合 402
9.9 表计算应用(3):帕累托分布——累计、合计及嵌套 406
9.10 表计算应用(4):金融ANR计算——表计算高级嵌套 409
9.11 表计算筛选器:优先级最低的筛选类型 413
9.11.1 使用RANK函数聚合判断完成筛选 413
9.11.2 使用偏移函数LOOKUP完成年度同比和筛选 415
9.12 表计算延伸应用:预测建模函数 416
9.12.1 MODEL_QUANTILE预测模型 417
9.12.2 MODEL_PERCENTILE预测模型 419
练习题目 420
第10章 结构化问题分析:LOD表达式与SQL聚合子查询 421
10.1 业务解析:理解LOD表达式的逻辑和本质 421
10.1.1 简单详细级别:“不同购买频次的客户数量” 421
10.1.2 多维详细级别:“各年度、不同矩阵年度的销售额贡献” 424
10.2 LOD表达式的“详细级别”及其与视图关系 428
10.2.1 从问题详细级别出发,理解高级问题的构成 428
10.2.2 主视图引用“更高聚合度”的详细级别聚合:占比分析 429
10.2.3 主视图引用“更低聚合度”的详细级别之聚合:购买力分析 432
10.2.4 主视图引用独立详细级别的聚合:客户矩阵分析 433
10.3 相对指定的LOD表达式及运算优先级 435
10.3.1 绝对指定和相对指定的LOD表达式 435
10.3.2 INCLUDE LOD引用更低聚合级别的聚合及优先级 437
10.3.3 EXCLUDE LOD引用更高聚合级别的聚合,以及优先级对比 439
10.4 超越LOD:计算的详细级别体系及其优先级 441
10.4.1 不同计算类型的应用场景与作用 442
10.4.2 层次分析法:理解计算的运算逻辑及其组合形式 443
10.4.3 Tableau计算、筛选、数据关系的优先级 445
10.5 走向实践:多遍聚合问题与结构化分析方法 446
10.5.1 方法论:高级问题分析的4个步骤 446
10.5.2 LOD多遍聚合:客户购买力分析的嵌套LOD计算 447
10.5.3 嵌套LOD的语法和SQL表示 452
10.6 客户分析专题:客户RFM相关案例分析 454
10.6.1 客户分析概论与常见指标体系 454
10.6.2 使用Tableau完成 RFM主题分析 457
10.6.3 单维度的分布案例:客户频次分布和生命周期分布 460
10.6.4 多维度的结构分析:与“客户获客时间”相关的分析案例 461
10.6.5 复购间隔:行级别计算和LOD计算的结合 464
10.6.6 客户留存分析:LOD表达式、表计算的结合 465
10.6.7 客户矩阵分析:客户价值分类 468
10.7 产品分析高级专题:购物篮分析的多个角度 470
10.7.1 购物篮比率:任意子类别相对于所有订单的比率 471
10.7.2 支持度、置信度和提升度分析:类别之间的关联推荐 472
10.7.3 指定类别的关联比率:筛选中包含“引用详细级别” 475
10.8 总结:高级计算的最佳实践 480
10.8.1 问题的3大构成与计算的4种类型 480
10.8.2 如何选择计算类型 482
练习题目 484
第11章 从数据管理到数据仓库:敏捷分析的基石 486
11.1 数据管理功能:以数据为中心 486
11.1.1 Tableau Catalog:数据资产目录和世系管理 487
11.1.2 Tableau Prep Conductor:数据ETL流程管理 491
11.1.3 Virtual Connections:数据库和分析之间的桥梁 492
11.1.4 Data Policy:为数据访问增加行级别权限 495
11.2 从数据管理(DM)到数据仓库(DW) 499
11.2.1 数据仓库是数据分析发展到一定阶段的产物 499
11.2.2 数据仓库的逻辑分层 502
11.3 ETL:数据仓库中的数据处理 504
11.3.1 敏捷ETL工具Prep Builder简介 504
11.3.2 敏捷ETL工具对数据分析的影响 505
11.4 建议:视Tableau为DW/BI平台 506
参考资料 507
內容試閱
第2版自序


感谢Tableau和读者的支持,是你们给了笔者继续前进的动力。
2020年年初,我把多年学习Tableau的所思、所想毫无保留地写出来,配以精致的图片出版发行。《数据可视化分析:Tableau原理与实践》一书收到了众多读者的一致好评,累计印刷8次,发行逾万册,多次入围“京东大数据推荐榜单”前三名。在读者群中,笔者认识了很多Tableau粉丝、企业用户及可视化爱好者。
过去两年多,Tableau产品持续更新迭代,笔者也进一步补充了SQL、数据库、数据仓库等基础知识,并对比学习了Power BI、帆软、观远等国内外多家优秀BI产品的应用。“实践是最好的老师”,笔者在分析项目咨询、Tableau企业培训、可视化开发项目的锻炼中,日渐意识到这本书中的诸多不足甚至错误,并放弃了小修小补的计划,重写此书作为近两年学习的总结。
于是,2022年4月,笔者开始重写本书的内容,并重新绘制、调整了大部分插图,作为第2版。历经波折,多次延迟,本书终于与读者见面。
这里,笔者总结第2版相对于第1版的内容改进。
第2版改进
— 增加对数字化转型的实践思考。
结合笔者多年的切身项目实践,本书总结了数据的应用及其发展阶段,数字化转型的多种路径和循序渐进的组织方案(见第1章)。
— 业务分析方法和体系更加成熟。
业务是分析的“土壤”。在项目咨询过程中,笔者提出了“业务—数据—分析”的框架体系,可以与企业业务流程相结合绘制数据地图(见第2章)。同时,围绕问题结构、聚合、聚合度和详细级别,构建了一个普适性的业务分析方法,适用于各种分析和BI工具,甚至可以作为衡量分析工具的一种尺度(见第3章)。
— 在数据合并、筛选、计算三大主题中,对比介绍了Excel、Tableau和SQL的应用场景。书中总结了“数据合并的分类矩阵”“两类筛选位置”“计算的分类”等实用方法,帮助没有相关技术背景的人更快实现超越,也有助于熟悉SQL的“技术派”更好地理解敏捷BI的精髓。高阶的BI工具绝非拖曳那般简单,在技术平民化的背后,是更巧妙的“业务灵魂”。
— 将“数据筛选和交互”独立为第6章内容,进一步强调筛选在业务分析中的重要性。筛选的类型多样、优先级复杂,应该尽可能避免滥用SUM IF类型的条件聚合。将筛选视为分析的独立环节,是优化分析性能的关键方式。
— 强化“详细级别”的概念(替代之前的“层次”概念)。在数据表详细级别(Table LOD)、视图详细级别(Viz LOD)之外,使用“引用详细级别”(Reference LOD)代表视图之外预先指定的详细级别。笔者把数据关系、筛选和计算融为一体,这是本书最重要的知识资产,是超越Tableau理解不同工具背后的分析共性的关键。
— 调整了第3篇的知识框架。没有计算,就没有无尽的业务分析,这也是本书最重要的内容之一。
? 第8章深入介绍了计算的两大分类:行级别计算完成数据准备、聚合计算完成业务分析。在介绍常见函数后,借助逻辑计算介绍了两类计算的区别和联系。
? 第9章使用了新的框架介绍Tableau表计算和SQL窗口函数,表计算代表的“抽象的二次抽象”,是迈向高级分析的台阶。
? 第10章则结合“SQL聚合子查询”深入讲解LOD原理,结合购物篮分析、客户分析等经典案例,把高级分析中“预先聚合”的理念,推广到更普遍的业务分析中。
— 增加了“从数据管理到数据仓库”的内容(见第11章),相关内容是从可视化分析走向专业的数据建模、数据方法的关键。“视Tableau Server为DW/BI平台”,给了更多企业全新选择。
— 受限于篇幅,移除了之前Prep Builder数据处理、Tableau Server相关的大部分内容。
致谢
每次写作完成,笔者总是迫不及待地分享。本书付梓之前,笔者在上海组织了“喜乐君精品课”线下活动,详尽介绍了本书的核心内容。教学相长,在分享过程中笔者进一步发现了自身知识体系的盲点。感谢来自天合光能、汉德车桥、上海电气、海南航空、上汽集团、英飞凌等企业的热心读者。
感谢继续支持和信任笔者的企业客户,笔者希望能用专业和热爱回报大家。
感谢Tableau,你给了笔者穿过迷雾的勇气,笔者也将无期限地支持你,对得起“Tableau传道士”的称号,对得起Tableau Zen Master/Visionary的全球荣誉。
感谢父母,感谢家人,“大爱无言”,笔者当用余生以行动回报。

喜乐君
2023年1月20日


第1版自序
鸟会飞是因为有羽毛吗——Tableau与笔者的分析之旅


笔者于2017年偶遇Tableau,从昨日的爱好到今朝的工作,仿佛一瞬,又好似半生。如今,笔者完成了之前未曾想象的任务——把笔者的所思所想、所知所悟以出版的方式分享给更多人。
理想主义者总是习惯性地低估困难,写书这件事情尤其如此。累计638张精心制作的插图,有别于博客文章,力求建立新的体系框架,你我虽隔书相望,但希望每一位读者都能感受到笔者毫无保留的写作态度与努力。2021年,有幸与Tableau艺术家Wendy一起入围Tableau Zen Master全球榜,这是读者和Tableau对笔者最好的认可。
与此同时,还是想谈一下笔者和Tableau的渊源,以此说明笔者如何以文科学历和业务背景从零开始成为今日的“Tableau大使”,这条路每个人都可以走,只需要用心与努力即可抵达。
1.笔者和Tableau的渊源
笔者在毕业后历经国企、创业、私企几番锻炼,于2017年回到婴贝儿担任总裁助理,忙里偷闲四处学习,并且获得了“买任何图书均可报销”的公司特权,受领导鼓励,也在公司义务培训Excel、消费心理学等。考虑到公司低效的“PPT数据传统”和自身专业数据分析知识的薄弱,因此私下搜寻各种大数据分析工具,最后被Tableau的灵活、易用和美观所折服。之后陆陆续续为运营、采购、人力资源等板块做了一些并非成熟的分析。
笔者是典型的“写作型”,因此从学习第一周开始,就陆陆续续记笔记、写博客,纯粹为了帮助自己增强理解,不料几年下来,竟然积累了可观的笔墨。“所有的成功都是长期主义的胜利”。数据和数据分析恰好是一个不错的“风口”,于是误打误撞地进入了这个“陌生但新鲜的行业”。
《经济学人》杂志中曾写道:“21世纪最重要的资源是数据”,但是不经分析的数据没有价值,如同“不经反省的人生不值得过”(苏格拉底),而这正是转型期的企业遇到的成长烦恼。笔者决定和Tableau同行,将自己多年的工作经验与笔者对数据的理解融为一体,认真服务每一位客户,同时获得自我的提升。笔者选择了Tableau,之后通过了Tableau Desktop和Server QA认证,并在参加Tableau峰会时认识了众多Tableau员工和爱好者,开始了开发客户、服务客户的美好旅程。
在服务客户的过程中,笔者不断积累自己的Tableau知识和业务理解,并持续更新博客以增强理解,并向更多客户传播Tableau文化。笔者从不拒绝客户的任何问题,把它视为最好的收集问题和不断学习的机会——没有什么是学习不能解决的问题,如果问题不能被解决,那就是学艺不精。追求超过预期的交付,不仅帮助笔者提高了客户的续费和增购的概率,而且不断积累了下一本书的素材。
2.从所知到所悟
在学习过程中,笔者不断阅读各类数据分析书籍,并仔细翻阅官方近万页的文档和白皮书。可惜的是,笔者找到的国内外每一本Tableau主题书籍,都只能满足笔者的初学需求,却不能满足向中高级进阶时的胃口,总觉得要义未精、框架欠明,如同武林秘籍缺少最后一章,即便各种招式纯熟,也难以在实战面前随心所欲。这种理解上的束缚,阻碍了为客户提供最高品质的培训和咨询。跟随山东大学王思悦老师学习,他教给笔者一种处事态度:“和人交往改变自己,和物交道改变对方”,因此,笔者希望重新构建Tableau的知识体系,并希望帮助初学者和高级分析师更好地使用Tableau产品。
在克里斯坦森教授《你要如何衡量你的人生》一书的开篇,提出了一个让笔者终生难忘的问题:“鸟会飞是因为有羽毛吗?”笔者曾经以为是,但正如克里斯坦森教授所言,人类上千年来一直尝试仿制轻盈的翅膀飞上天,最后,倒是成吨的钢铁飞机实现了。100年前,人类在“流体力学”和“空气动力学”领域积累了足够的知识,才实现了飞翔的梦想,这就是原理的重要性。很多人觉得掌握原理是少数人的事情,殊不知,原理是具有实践性的,它赋予了我们“举一反三”的能力。
因此,笔者迫切地希望洞察Tableau“拖曳”、可视化,特别是高级计算背后的原理,只有掌握了原理,笔者才能用最简单的语言,让所有客户以最少的时间和金钱成本换来最高效的培训和使用效果。而通往大彻大悟的道路只有一条,那就是持续的努力和深度的思考相融合的道路。
整个2019年,笔者一方面不断地向Tableau最难的高级计算和高级互动发起总攻,并持续修改博客文章作为通达明了的明证;另一方面每月组织Tableau公开课程,在分享过程中不断深化自我理解,并在为中原消费金融、以岭药业等客户提供培训的过程中不断总结本书的宏观框架。2019年在国联水产进行的客户培训中,获得了本书第5章的关键灵感。2021年,在长隆集团信息部门的内部交流中获得了“业务字段、分析字段”的关键灵感,并在平安普惠的项目中开始构思“业务数据分析地图”。
在这个过程中,笔者持续写作博客文章以作记录和思考,如今笔者的不少Tableau博客文章,特别是关于“LOD详细级别表达式”原理和案例解读系列,几乎可以与官方的介绍文章并驾齐驱。2020年年初,因疫情在家,得以从头重写每一个细节及其思路,并把基础计算和高级计算融为一体,形成了全新的讲解体系,从而保证初学者也可以快速掌握最高难度的知识环节。
最后,笔者找到了从Excel分析到Tableau数据分析的根本性差异,即层次(LOD详细级别)。客观的数据表详细级别(Table LOD)描述数据结构和颗粒度,主观的视图详细级别(Viz LOD)描述业务问题及其相关性,并通过计算的多种分类把二者融为一体。全书都贯穿了“层次分析”的思路,并在高级计算部分得以升华——高级计算的实质就是多层次问题分析。因此,读者在本书中能看到很多全新的内容,特别是用层次(详细级别)理解大数据分析的核心特征、理解数据结构并识别行级别唯一性、理解Tableau的计算并引导如何选择等。
而精心绘制的插图,旨在用可视化的方式增强理解。通过二次处理,尽可能提高每一幅插图的知识密度。
3.大数据时代的趋势与业务驱动的数据分析
随着互联网经济的蓬勃发展,大数据时代已经成为不可回避的事实。在经济竞争面前,企业更应该追求精益分析驱动的精益成长,构建以分析为中心的敏捷平台变得不可或缺。
因此,敏捷BI(商业智能)已经是大势所趋、不可抵挡。企业成长依赖于在竞争环境中不断做出最优的决策,而决策来自充分地建立假设并高效地验证,数据分析是连接数据资产与价值决策的纽带,而敏捷BI能提高数据的利用效率和企业的决策效率。“分析即选择,决策即择优”,数据分析可以直接创造企业价值,未来已来,所有的企业都将是数据驱动型的组织。
对于企业而言,Tableau提供了敏捷的“数据仓库、商业智能一体化”整体方案。不管是中小企业还是大型企业,Tableau都是极佳的企业级大数据可视化分析平台,它在面向业务方面的卓越表现,迄今难有同行产品可以比拟。
对于业务分析师而言,Tableau入门容易、使用灵活,因此它几乎适用于企业中的每一位数据用户和业务决策者。同时,Tableau博大精深、足够专业,在可视化样式、互动探索、高级计算等方面有无限空间值得探索,因此不断钻研的Tableau分析师可以为自己构建足够高的技术壁垒,从而捍卫自己的专业领地。这也是笔者的选择和道路,只要努力,人人皆可模仿,没有所谓的“学习力”,需要的只是用心和努力而已。
在这条充满光明的道路上,最大的障碍其实不是工具,而是人和文化。借助本书,衷心地希望更多的人能熟练使用Tableau,并建立自己的职业壁垒,节省时间就是拯救个人生命,提高效率就是创造企业利润。
4.致谢
从博客文章到一本书,这是之前笔者还未曾预料的事情;因为疫情在家隔离,一个春天,不料梦想就变成了现实。
特别感谢唐小强先生、百威啤酒刘洋先生、红塔集团付聪先生、金发科技黄彬祥先生及其他众多读者为本书勘误做出的贡献。
特别感谢Tableau赋予的学习机会,让笔者认识了各行各业的企业客户、朋友和读者。
感谢家人,他们给了笔者生活的意义。
感谢时间,感谢充满坎坷与喜乐的人生。

喜乐君
2023年1月20日修改

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.