數(shù)據(jù)思維與大數(shù)據(jù)基礎(chǔ)
定 價(jià):59.8 元
當(dāng)前圖書已被 2 所學(xué)校薦購過!
查看明細(xì)
- 作者:陳華 柳毓松 阮宗利
- 出版時(shí)間:2025/9/1
- ISBN:9787115679765
- 出 版 社:人民郵電出版社
- 中圖法分類:TP274
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
本書是面向大數(shù)據(jù)人才培養(yǎng)的高等學(xué)校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)系列教材中的一本,通過把數(shù)據(jù)思維融入全書各章,并通過 Python 實(shí)現(xiàn)相關(guān)案例,使抽象的數(shù)據(jù)思維具體化,從而加深讀者對數(shù)據(jù)的感性認(rèn)識,提高讀者對數(shù)據(jù)思維的理解能力。本書首先介紹了大數(shù)據(jù)相關(guān)的概念,然后根據(jù)數(shù)據(jù)處理流程的邏輯順序,對大數(shù)據(jù)平臺和大數(shù)據(jù)開發(fā)進(jìn)行了深入介紹?紤]到數(shù)據(jù)的價(jià)值化發(fā)展趨勢,本書也討論大數(shù)據(jù)倫理與法規(guī)、大數(shù)據(jù)與人工智能大模型和數(shù)據(jù)資產(chǎn)與交易流通等內(nèi)容的討論。最后給出了基于競賽的大數(shù)據(jù)綜合案例實(shí)踐。另外,本書免費(fèi)提供配套PPT、實(shí)驗(yàn)及程序及其講解視頻等基本教學(xué)資料。
本書可作為理工類、經(jīng)管類等專業(yè)學(xué)生學(xué)習(xí)大數(shù)據(jù)知識的基礎(chǔ)教材,也可供科技工作者參考。
(1)內(nèi)容全面,結(jié)構(gòu)合理:每章內(nèi)容分導(dǎo)讀案例、理論知識、應(yīng)用、習(xí)題各部分。
(2)取長補(bǔ)短,講清原理:力圖在通俗易懂講解理論知識的基礎(chǔ)上,豐富實(shí)用性案例,清晰、全面地介紹大數(shù)據(jù)技術(shù)與應(yīng)用知識。
(3)深入介紹數(shù)據(jù)思維內(nèi)容。
(1)內(nèi)容全面,結(jié)構(gòu)合理:每章內(nèi)容分導(dǎo)讀案例、理論知識、應(yīng)用、習(xí)題各部分。
(2)取長補(bǔ)短,講清原理:力圖在通俗易懂講解理論知識的基礎(chǔ)上,豐富實(shí)用性案例,清晰、全面地介紹大數(shù)據(jù)技術(shù)與應(yīng)用知識。
(3)深入介紹數(shù)據(jù)思維內(nèi)容。
陳華 青島市西海岸大數(shù)據(jù)智庫專家,全國高校人工智能與大數(shù)據(jù)創(chuàng)新聯(lián)盟理事,山東省大數(shù)據(jù)研究會理事,現(xiàn)任中國石油大學(xué)(華東)數(shù)據(jù)科學(xué)與統(tǒng)計(jì)系主任,數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)負(fù)責(zé)人。目前主要從事地球物理數(shù)據(jù)處理與分析、多核計(jì)算、智能算法等方面的教學(xué)和科研工作。先后主持和參與國家自然科學(xué)基金、山東省自然科學(xué)基金等縱向課題8項(xiàng)和其它橫向課題10余項(xiàng)。在國內(nèi)外期刊發(fā)表教學(xué)和科研論文30余篇,軟件著作權(quán)4項(xiàng),教材4部。
第 1章 大數(shù)據(jù)概述 1
1.1 數(shù)據(jù) 1
1.2 大數(shù)據(jù) 5
1.3 大數(shù)據(jù)發(fā)展歷史 8
1.4 大數(shù)據(jù)研究內(nèi)容 9
1.5 大數(shù)據(jù)應(yīng)用場景與領(lǐng)域 11
第 2章 大數(shù)據(jù)思維 15
2.1 數(shù)據(jù)科學(xué) 15
2.2 數(shù)據(jù)全生命周期管理 18
2.3 數(shù)據(jù)思維 26
2.4 數(shù)據(jù)范式 28
2.5 大數(shù)據(jù)思維 29
2.6 常見的大數(shù)據(jù)思維方式 29
2.7 案例 30
第3章 大數(shù)據(jù)平臺 34
3.1 大數(shù)據(jù)與云計(jì)算關(guān)系 34
3.2 Hadoop平臺 34
3.2.1 Hadoop簡介 34
3.2.2 HDFS工作機(jī)制 36
3.2.3 HDFS命令 40
3.2.4 分布式并行計(jì)算框架MapReduce 40
3.3 Spark平臺 43
3.3.1 Spark 的核心組件 43
3.3.2 Spark工作機(jī)制 45
3.3.3 分布式計(jì)算模型與方式 46
3.3.4 Hadoop和Spark對比情況 48
第4章 大數(shù)據(jù)開發(fā) 50
4.1 大數(shù)據(jù)開發(fā)流程 50
4.2 需求分析 51
4.3 數(shù)據(jù)獲取 53
4.4 探索性數(shù)據(jù)分析 59
4.4.1 探索性數(shù)據(jù)分析概念 59
4.4.2 探索性數(shù)據(jù)分析理論與技術(shù) 59
4.4.3 青島空氣質(zhì)量探索性數(shù)據(jù)分析 69
4.5 數(shù)據(jù)加工 77
4.5.1 數(shù)據(jù)加工的內(nèi)容 77
4.5.2 數(shù)據(jù)清洗 78
4.5.3 數(shù)據(jù)轉(zhuǎn)換 85
4.5.4 數(shù)據(jù)整合 98
4.5.5 青島空氣質(zhì)量數(shù)據(jù)加工 99
4.6 特征工程 103
4.6.1 特征工程定義 103
4.6.2 特征選擇 104
4.6.3 特征提取 108
4.6.4 特征創(chuàng)建 112
4.6.5 特征提取和特征選擇、特征創(chuàng)建之間的區(qū)別 112
4.6.6 數(shù)據(jù)不平衡問題 113
4.6.7 青島空氣質(zhì)量特征處理 117
4.7 數(shù)據(jù)建模 124
4.7.1 數(shù)據(jù)分析 125
4.7.2 統(tǒng)計(jì)方法 126
4.7.3 機(jī)器學(xué)習(xí)方法 132
4.7.4 青島空氣數(shù)據(jù)建模 139
4.7.5 大作業(yè) 144
第5章 大數(shù)據(jù)倫理與法規(guī) 145
5.1 大數(shù)據(jù)倫理概念 145
5.2 大數(shù)據(jù)倫理產(chǎn)生原因 147
5.3 大數(shù)據(jù)倫理治理 153
5.4 大數(shù)據(jù)倫理案例:亞馬遜AI招聘工具性別歧視事件 157
5.5 大數(shù)據(jù)倫理案例:明確零工法律定位,規(guī)范平臺算法管理 161
第6章 大數(shù)據(jù)與人工智能大模型 166
6.1 人工智能大模型 166
6.2 人工智能大模型的核心技術(shù)與訓(xùn)練方法 167
6.3 大數(shù)據(jù)與人工智能大模型的關(guān)系 170
6.4 大數(shù)據(jù)與人工智能大模型技術(shù)發(fā)展趨勢 171
6.5 人工智能大模型應(yīng)用領(lǐng)域 172
第7章 數(shù)據(jù)資產(chǎn)與交易流通 177
7.1 國家政策 177
7.2 數(shù)據(jù)資產(chǎn) 179
7.3 數(shù)據(jù)確權(quán) 184
7.4 數(shù)據(jù)資產(chǎn)評估 187
7.5 數(shù)據(jù)交易 195
7.6 數(shù)據(jù)流通 196
7.7 可信數(shù)據(jù)空間 198
第8章 大數(shù)據(jù)綜合案例實(shí)踐 203
8.1 問題提出 203
8.2 數(shù)據(jù)處理 204
8.3 數(shù)據(jù)分析 213
8.4 天氣預(yù)測 218
附錄 225
參考文獻(xiàn) 233