本書是一本面向在校大學生以及數據治理領域業(yè)務人員的實用教程。全書共四篇,前三篇(概念篇、體系篇、保障篇)包括11章:數據治理概述,數據治理框架,數據戰(zhàn)略規(guī)劃,數據采集,數據存儲,數據管理,數據應用,數據治理價值評估,數據治理組織、制度與規(guī)范,數據治理文化,數據治理工具。第四篇為典型案例篇,詳細介紹了三個具有代表性的典型數據治理案例。本書語言通俗易懂、體系完整、案例豐富,系統(tǒng)、全面地講解了數據治理的目標、價值、方式、方法、工具等各個領域的相關知識,可以幫助讀者快速理解數據治理的概念,認識數據治理的架構,掌握數據治理的基本方法。
本書適用于數字經濟、數據科學與大數據技術等開設數據治理相關課程的專業(yè),既可作為本科層次的教材,也可作為研究生層次的教材,無論對于初學者還是對于想要深入了解專業(yè)數據治理知識的讀者來說,本書都是讀物。
系統(tǒng)全面:全景式講解數據治理的概念、體系、方法、工具、案例
產教融合:作者團隊聚合產、學、研三方力量,實現(xiàn)教學與行業(yè)實踐的充分結合
數字化精品:配備全套微課教學視頻、教學PPT、教學大綱等數字教學資源
前言
在數字化轉型的浪潮中,數據治理已經成為眾多領域的重要議題。特別是在國家大力推動數字化轉型、人工智能技術不斷發(fā)展的背景下,數據治理的重要性更是日益凸顯。為了幫助廣大讀者更好地理解和應用數據治理,我們編寫了這本《數據治理概論》。
本書分為四篇,分別是概念篇、體系篇、保障篇和典型案例篇,主要介紹了數據治理體系框架以及各個關鍵活動,通過豐富的案例分析,幫助讀者深入理解數據治理的實踐和運用。概念篇介紹了數據治理的基本概念、原則和方法,以及數據治理框架相關內容,幫助讀者建立起清晰的數據治理認知。體系篇詳細闡述了數據治理體系框架,包括數據戰(zhàn)略規(guī)劃、數據采集、數據存儲、數據管理、數據應用、數據治理價值評估等多個方面。保障篇介紹了數據治理組織、制度與規(guī)范,數據治理文化,以及數據治理工具等內容。通過對這些關鍵活動的深入了解,讀者將能夠全面掌握數據治理的核心內容。典型案例篇分享了國內不同行業(yè)的優(yōu)秀實踐,涵蓋多個領域。這些案例將幫助讀者更好地理解數據治理在實踐中的應用,同時也可以為讀者在具體工作中提供有益的參考和啟示。此外,本書還特別關注了數據治理關鍵技術的應用和發(fā)展給數據治理帶來的挑戰(zhàn)和機遇。在未來數字化轉型和人工智能技術的快速發(fā)展中,數據治理將顯得尤為重要。
本書具備鮮明的產教融合特色,作者團隊由來自廈門大學、美林數據、御數坊、用友網絡等的一線教師、專家構成,聚合產、學、研三方力量,使教材內容充分融入行業(yè)經驗,實現(xiàn)了教學與行業(yè)的無縫銜接;本書還配備了豐富的數字教學資源,包括全套微課視頻、教學課件、教學大綱等,能夠充分滿足課堂教學與實踐操作的需求。
我們希望通過本書的出版,能夠幫助廣大讀者更好地理解和應用數據治理,為未來的職業(yè)生涯打好基礎。同時,我們也希望本書能夠為國內的數據治理研究和應用提供有益的參考,推動數據治理事業(yè)的發(fā)展。
在本書編寫過程中,我們得到了眾多專家學者的支持和幫助,在此表示衷心的感謝,同時也要感謝機械工業(yè)出版社的大力支持和廣大讀者的關注。我們相信在未來的學習和工作中,本書將成為您不可或缺的參考書籍之一。
編 者
2024年4月
主 編 劉宏林子雨夏小云
副主編 畢珍蔣夢琴石秀峰
參 編 李曉燕 肖西偉 牛清娜 申鎮(zhèn) 郭田奇 吳元全 趙佳 張靖笙 林建興
錄
前言
概 念 篇
第1章 數據治理概述2
1.1 數據治理的基本概念3
1.1.1 數據3
1.1.2 數據資產及其管理4
1.1.3 數字化6
1.1.4 數據治理9
1.2 數據治理的發(fā)展歷程及趨勢14
1.2.1 數據治理的發(fā)展歷程14
1.2.2 數據治理的發(fā)展趨勢21
1.3 數據治理在現(xiàn)代組織中的
定位25
1.3.1 數據治理賦能企業(yè)運營25
1.3.2 數據治理是企業(yè)數據資產管理的
基石26
1.3.3 數據治理是企業(yè)數字化轉型的
必經之路26
1.4 數據治理的誤區(qū)27
1.4.1 項目式的數據治理27
1.4.2 數據治理只是技術部門的事28
1.4.3 數據治理唯工具論28
1.4.4 數據治理可以短期見效29
1.4.5 找到問題卻不解決問題29
1.4.6 只定標準卻不落地30
1.4.7 大而全的數據治理30
1.4.8 為治理而治理31
1.4.9 脫離企業(yè)現(xiàn)狀,治理目標過于
理想化31
1.5 數據管理32
1.5.1 數據管理的概念32
1.5.2 數據管理框架32
1.5.3 數據管理與數據治理的關系35
本章小結36
本章習題36
第2章 數據治理框架38
2.1 主流數據治理框架介紹39
2.1.1 ISO/IEC 38505的數據治理
框架39
2.1.2 DGI數據治理框架40
2.1.3 DAMA數據管理框架41
2.1.4 GB/T 34960.52018的數據治理
框架41
2.1.5 DCMM數據管理框架42
2.1.6 數據資產管理框架44
2.2 本書數據治理框架45
2.3 數據治理框架的作用46
2.3.1 形成數據治理的閉環(huán)46
2.3.2 聚焦業(yè)務價值的發(fā)現(xiàn)47
本章小結47
本章習題48
體 系 篇
第3章 數據戰(zhàn)略規(guī)劃50
3.1 數據戰(zhàn)略規(guī)劃的概念51
3.2 數據戰(zhàn)略從規(guī)劃到執(zhí)行52
3.2.1 數據戰(zhàn)略規(guī)劃的制定52
3.2.2 數據戰(zhàn)略規(guī)劃的實施54
3.2.3 數據戰(zhàn)略規(guī)劃的評估55
3.3 數據戰(zhàn)略規(guī)劃工具56
3.3.1 企業(yè)戰(zhàn)略規(guī)劃中使用的工具
介紹56
3.3.2 企業(yè)數據戰(zhàn)略規(guī)劃中使用的
工具介紹66
本章小結70
本章習題70
第4章 數據采集71
4.1 數據采集的概念72
4.2 數據采集的范圍72
4.2.1 業(yè)務范圍的確定72
4.2.2 數據采集范圍的確定73
4.2.3 數據采集范圍的管理74
4.3 數據采集的方法75
4.3.1 數據獲取的典型技術手段75
4.3.2 數據獲取手段的選擇75
4.4 數據采集關鍵技術78
4.4.1 數據源連接技術79
4.4.2 數據抽取技術79
4.4.3 數據傳輸協(xié)議80
4.4.4 數據格式轉換與映射技術81
4.4.5 數據質量驗證技術82
4.4.6 典型的數據采集工具83
本章小結84
本章習題85
第5章 數據存儲86
5.1 數據存儲的概念87
5.2 數據存儲需求88
5.2.1 不同業(yè)務需求的數據存儲
方式88
5.2.2 幾類典型的數據存儲架構89
5.3 數據存儲模型設計94
5.3.1 數據模型的定義94
5.3.2 從概念模型到物理模型96
5.3.3 數據存儲模型的選擇依據99
5.3.4 典型的數據存儲模型99
5.3.5 數據模型管理103
5.4 數據存儲架構設計103
5.4.1 數據存儲架構概述103
5.4.2 數據存儲架構設計步驟104
5.4.3 典型的數據存儲系統(tǒng)109
5.4.4 數據存儲架構的設計114
本章小結118
本章習題118
第6章 數據管理119
6.1 元數據管理120
6.1.1 元數據的定義120
6.1.2 元數據需求120
6.1.3 元模型設計121
6.1.4 元數據維護125
6.1.5 元數據應用125
6.2 數據標準管理125
6.2.1 數據標準的定義125
6.2.2 組織數據的構成126
6.2.3 數據標準的分類128
6.2.4 數據標準的構成137
6.2.5 數據標準的制定137
6.2.6 數據標準的落地139
6.3 主數據管理141
6.3.1 主數據的定義141
6.3.2 主數據管理的意義144
6.3.3 主數據的識別144
6.3.4 主數據分類146
6.3.5 主數據編碼148
6.3.6 主數據建模149
6.3.7 主數據清洗150
6.3.8 主數據映射治理151
6.3.9 主數據集成151
6.3.10 主數據運維管理153
6.3.11 主數據質量管理153
6.3.12 主數據安全管理154
6.4 數據質量管理154
6.4.1 數據質量管理的定義154
6.4.2 數據質量管理的價值156
6.4.3 數據質量生命管理周期157
6.4.4 數據質量規(guī)劃158
6.4.5 數據質量評估159
6.4.6 數據質量提升164
6.4.7 數據質量監(jiān)控169
6.4.8 數據質量改進170
6.4.9 數據質量培訓和教育170
6.4.10 數據質量管理能力評價171
6.5 數據安全管理173
6.5.1 數據安全的定義173
6.5.2 數據安全策略177
6.5.3 數據安全管控178
6.5.4 數據安全審計182
本章小結183
本章習題183
第7章 數據應用185
7.1 數據分析186
7.1.1 數據分析的概念186
7.1.2 數據分析類型187
7.1.3 數據分析方法187
7.2 數據共享192
7.2.1 數據共享的概念192
7.2.2 數據共享的主要活動195
7.2.3 數據共享價值評估198
7.3 數據開放198
7.3.1 數據開放的概念198
7.3.2 數據開放的主要活動200
7.3.3 數據開放價值評估200
7.4 數據賦能業(yè)務的典型場景201
7.4.1 數據驅動業(yè)務202
7.4.2 數據賦能管理202
7.4.3 商業(yè)模式創(chuàng)新203
7.5 數據分析關鍵技術204
7.5.1 數據可視化205
7.5.2 統(tǒng)計分析212
7.5.3 機器學習217
7.5.4 知識圖譜220
本章小結226
本章習題226
第8章 數據治理價值評估228
8.1 數據治理價值評估的概念229
8.2 數據治理價值評估的原則229
8.3 業(yè)務價值評估230
8.3.1 數據治理對業(yè)務活動的影響和
貢獻230
8.3.2 業(yè)務價值評估方法232
8.4 成本效益評估232
8.4.1 數據治理對成本效益的影響和
貢獻232
8.4.2 成本效益評估方法233
8.5 風險管理評估234
8.5.1 數據治理對風險管理的影響和
貢獻234
8.5.2 風險管理評估方法235
8.6 組織能力評估235
8.6.1 組織在數據治理能力方面的評估
內容235
8.6.2 組織能力評估方法236
8.7 持續(xù)改進評估236
8.7.1 數據治理的持續(xù)改進效果的評估
內容236
8.7.2 數據治理的持續(xù)改進效果的評估
方法238
8.8 價值評估工作的開展239
8.8.1 確定評估目標239
8.8.2 確定評估指標240
8.8.3 收集數據241
8.8.4 分析數據242
8.8.5 解釋結果243
8.8.6 編寫評估報告243
8.8.7 反饋和改進244
本章小結245
本章習題245
保 障 篇
第9章 數據治理組織、制度與
規(guī)范247
9.1 數據治理組織248
9.1.1 數據治理組織的概念248
9.1.2 數據治理組織的作用250
9.1.3 數據認責機制251
9.1.4 數據治理溝通256
9.2 數據治理制度與規(guī)范258
9.2.1 數據治理制度的概念及作用258
9.2.2 數據治理規(guī)范的概念及作用262
本章小結267
本章習題267
第10章 數據治理文化268
10.1 數據治理文化的概念269
10.2 數據治理文化的建立269
10.2.1 意識和認知269
10.2.2 領導力和支持270
10.2.3 溝通和培訓272
10.2.4 合作和協(xié)作273
10.2.5 激勵和獎勵274
10.2.6 監(jiān)督和評估275
10.3 數據文化與數據治理框架276
本章小結277
本章習題278
第11章 數據治理工具279
11.1 數據采集工具280
11.2 數據存儲工具280
11.2.1 開源的關系數據庫280
11.2.2 開源的分析數據存儲工具281
11.2.3 開源大數據存儲工具281
11.2.4 開源知識圖譜存儲工具282
11.3 數據管理工具283
11.3.1 開源元數據管理工具283
11.3.2 開源主數據管理工具283
11.3.3 開源數據模型管理工具283
11.3.4 開源數據質量管理工具284
11.4 數據應用工具284
11.4.1 數據可視化工具284
11.4.2 數據分析工具285
11.4.3 AI工具285
本章小結286
本章習題286
典型案例篇
第12章 某能源企業(yè)數據治理288
12.1 項目背景289
12.2 建設方案289
12.3 建設效果294
第13章 某制造企業(yè)數據治理295
13.1 項目背景296
13.2 企業(yè)數據治理痛點296
13.3 業(yè)務數據現(xiàn)狀分析296
13.4 數據治理建設目標297
13.5 數據生態(tài)解決方案297
13.6 數據治理實施成果298
13.7 業(yè)務應用場景的實現(xiàn)成果300
13.8 經驗總結301
第14章 某金融企業(yè)數據治理302
14.1 項目背景303
14.2 企業(yè)面臨的挑戰(zhàn)303
14.3 建設方案303
14.4 實施成果306
參考文獻307