數(shù)據(jù)科學(xué)理論與實(shí)踐--基于Python的實(shí)現(xiàn)
定 價:68 元
當(dāng)前圖書已被 8 所學(xué)校薦購過!
查看明細(xì)
- 作者:何曙光
- 出版時間:2024/5/1
- ISBN:9787030784063
- 出 版 社:科學(xué)出版社
- 中圖法分類:TP311.561
- 頁碼:326
- 紙張:
- 版次:1
- 開本:16
本書內(nèi)容涵蓋數(shù)據(jù)科學(xué)基礎(chǔ)知識,介紹了數(shù)據(jù)科學(xué)的工作流程,包括數(shù)據(jù)采集、數(shù)據(jù)整理和探索、數(shù)據(jù)可視化和數(shù)據(jù)建模預(yù)測等技術(shù),并通過文本、圖像、語音等前沿應(yīng)用,引入人工智能技術(shù)在數(shù)據(jù)科學(xué)領(lǐng)域應(yīng)用的新成果。全書設(shè)計(jì)收集了多個數(shù)據(jù)分析案例,采用Python及相關(guān)科學(xué)計(jì)算工具包介紹數(shù)據(jù)分析實(shí)現(xiàn)的方法,幫助讀者通過實(shí)際應(yīng)用理解數(shù)據(jù)科學(xué)知識,掌握實(shí)踐技能,運(yùn)用統(tǒng)計(jì)學(xué)、人工智能等技術(shù)解決實(shí)際問題。本書通俗易懂、實(shí)例豐富、技術(shù)先進(jìn),配備豐富的教學(xué)資源,可作為各類大專院校數(shù)據(jù)科學(xué)、大數(shù)據(jù)技術(shù)的入門教材,計(jì)算機(jī)基礎(chǔ)教學(xué)較高層次課程的教材,也可以作為數(shù)據(jù)科學(xué)實(shí)踐的技術(shù)參考書。
更多科學(xué)出版社服務(wù),請掃碼獲取。
中國質(zhì)量協(xié)會學(xué)術(shù)教育工作委員會委員、天津市工業(yè)工程學(xué)會副理事長、天津市現(xiàn)場統(tǒng)計(jì)研究會理事
目錄
前言
第1章 數(shù)據(jù)科學(xué)概論1
1.1 數(shù)據(jù)與大數(shù)據(jù)1
1.1.1 數(shù)據(jù)、信息和知識1
1.1.2 大數(shù)據(jù)3
1.2 數(shù)據(jù)科學(xué)及其工作流程概述4
1.2.1 數(shù)據(jù)科學(xué)概述4
1.2.2 數(shù)據(jù)科學(xué)工作流程4
習(xí)題6
第2章 Python基礎(chǔ)7
2.1 Python概述7
2.1.1 計(jì)算機(jī)語言概述7
2.1.2 Python語言簡介8
2.1.3 Python解釋器及開發(fā)環(huán)境的安裝9
2.2 Python基礎(chǔ)12
2.2.1 Python基礎(chǔ)語法12
2.2.2 Python復(fù)雜數(shù)據(jù)類型13
2.2.3 Python運(yùn)算符19
2.2.4 Python控制語句20
2.3 函數(shù)和類的定義27
2.3.1 Python函數(shù)的定義和調(diào)用27
2.3.2 Python與面向?qū)ο缶幊?0
2.4 Python包31
2.4.1 Python包的結(jié)構(gòu)和導(dǎo)入31
2.4.2 Python常用包簡介33
習(xí)題33
第3章 Python常用模塊35
3.1 numpy與矩陣運(yùn)算35
3.1.1 numpy多維數(shù)組基礎(chǔ)35
3.1.2 數(shù)組索引39
3.1.3 數(shù)組運(yùn)算40
3.1.4 numpy簡單統(tǒng)計(jì)函數(shù)41
3.2 基于pandas的數(shù)據(jù)操縱與管理42
3.2.1 pandas基礎(chǔ)43
3.2.2 DataFrame的切片和計(jì)算45
3.2.3 DataFrame數(shù)據(jù)運(yùn)算48
3.2.4 數(shù)據(jù)的合并54
3.3 基于matplotlib和seaborn的數(shù)據(jù)可視化57
3.3.1 matplotlib數(shù)據(jù)可視化概述57
3.3.2 matplotlib數(shù)據(jù)可視化示例60
3.3.3 seaborn數(shù)據(jù)可視化67
3.4 基于sympy的符號計(jì)算74
3.4.1 sympy基礎(chǔ)74
3.4.2 表達(dá)式操作75
3.4.3 積分與微分78
3.4.4 sympy方程求解81
3.4.5 sympy與函數(shù)可視化82
3.5 基于scipy的科學(xué)計(jì)算83
3.5.1 scipy線性代數(shù)84
3.5.2 數(shù)值積分86
3.5.3 插值87
習(xí)題91
第4章 基于Python的最優(yōu)化92
4.1 最優(yōu)化問題的形式化定義與分類92
4.2 基于scipy的函數(shù)優(yōu)化93
4.2.1 無約束最優(yōu)化93
4.2.2 約束最優(yōu)化98
4.2.3 其他最優(yōu)化算法101
4.3 基于cvxpy的凸優(yōu)化建模與求解103
4.3.1 凸優(yōu)化的基本概念104
4.3.2 cvxpy及凸優(yōu)化問題求解106
4.3.3 凸優(yōu)化問題實(shí)例116
4.4 基于gurobipy的數(shù)學(xué)規(guī)劃建模與求解134
4.4.1 Gurobi簡介134
4.4.2 基于gurobipy求解數(shù)學(xué)規(guī)劃的步驟135
4.4.3 gurobipy建模與求解實(shí)例138
4.4.4 gurobipy中的常用問題轉(zhuǎn)換技巧145
習(xí)題147
第5章 基于Python的統(tǒng)計(jì)分析148
5.1 scipy與統(tǒng)計(jì)分布148
5.1.1 基于scipy的基本統(tǒng)計(jì)分布148
5.1.2 主要離散分布簡介149
5.1.3 主要連續(xù)分布簡介153
5.1.4 抽樣分布158
5.1.5 基本統(tǒng)計(jì)分析160
5.2 基于Python的分布參數(shù)估計(jì)163
5.2.1 參數(shù)的點(diǎn)估計(jì)164
5.2.2 參數(shù)的區(qū)間估計(jì)165
5.2.3 存在截尾數(shù)據(jù)的韋布爾分布參數(shù)估計(jì)實(shí)例167
5.3 假設(shè)檢驗(yàn)169
5.3.1 假設(shè)檢驗(yàn)的基本概念169
5.3.2 scipy中的假設(shè)檢驗(yàn)170
5.4 基于Python的統(tǒng)計(jì)模型174
5.4.1 線性回歸174
5.4.2 廣義線性模型179
5.4.3 廣義估計(jì)方程181
5.4.4 廣義加性模型182
5.4.5 基于表達(dá)式的模型定義184
習(xí)題186
第6章 基于Python的機(jī)器學(xué)習(xí)187
6.1 機(jī)器學(xué)習(xí)概述187
6.1.1 機(jī)器學(xué)習(xí)及相關(guān)概念187
6.1.2 機(jī)器學(xué)習(xí)的結(jié)構(gòu)189
6.1.3 基于Python的機(jī)器學(xué)習(xí)192
6.1.4 sklearn基礎(chǔ)192
6.2 監(jiān)督學(xué)習(xí)模型199
6.2.1 分類模型199
6.2.2 回歸模型217
6.2.3 集成方法223
6.3 非監(jiān)督學(xué)習(xí)算法229
6.3.1 聚類229
6.3.2 高斯混合模型234
6.3.3 流形學(xué)習(xí)235
6.3.4 信號成分分解237
6.3.5 異常檢測239
6.4 機(jī)器學(xué)習(xí)模型選擇和評估242
6.4.1 模型選擇與評估242
6.4.2 超參數(shù)設(shè)置247
6.4.3 特征選擇250
6.4.4 模型的保存和讀取252
習(xí)題253
第7章 基于PyTorch的神經(jīng)網(wǎng)絡(luò)254
7.1 神經(jīng)網(wǎng)絡(luò)254
7.1.1 神經(jīng)網(wǎng)絡(luò)基本原理254
7.1.2 激活函數(shù)255
7.1.3 神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程256
7.2 基于PyTorch的神經(jīng)網(wǎng)絡(luò)建模257
7.2.1 Torch簡介258
7.2.2 變量和自動求導(dǎo)機(jī)制autograd259
7.3 PyTorch神經(jīng)網(wǎng)絡(luò)建模262
7.4 基于PyTorch的神經(jīng)網(wǎng)絡(luò)示例267
7.4.1 回歸問題267
7.4.2 分類問題268
7.4.3 多項(xiàng)式擬合問題269
習(xí)題271
第8章 網(wǎng)絡(luò)文本數(shù)據(jù)分析與實(shí)踐272
8.1 網(wǎng)絡(luò)文本數(shù)據(jù)分析概述272
8.1.1 網(wǎng)絡(luò)數(shù)據(jù)分析的基本流程272
8.1.2 網(wǎng)絡(luò)數(shù)據(jù)分析主要應(yīng)用場景273
8.1.3 網(wǎng)絡(luò)數(shù)據(jù)分析典型案例273
8.2 Web應(yīng)用構(gòu)成要素及工作流程275
8.2.1 網(wǎng)頁構(gòu)成要素276
8.2.2 Web訪問請求和響應(yīng)過程277
8.2.3 靜態(tài)網(wǎng)頁和動態(tài)網(wǎng)頁280
8.2.4 審查網(wǎng)頁元素282
8.3 基于Python的網(wǎng)絡(luò)數(shù)據(jù)獲取283
8.3.1 User-Agent283
8.3.2 基于urllib的網(wǎng)絡(luò)數(shù)據(jù)獲取284
8.3.3 基于requests包的網(wǎng)絡(luò)數(shù)據(jù)獲取287
8.4 網(wǎng)絡(luò)數(shù)據(jù)解析289
8.4.1 正則表達(dá)式289
8.4.2 基于lxml的信息提取291
8.4.3 Beautiful Soup293
8.5 文本處理298
8.5.1 數(shù)據(jù)預(yù)處理298
8.5.2 中文分詞300
8.5.3 去除停用詞301
8.5.4 關(guān)鍵詞分析302
8.6 文本數(shù)據(jù)建模與分析306
8.6.1 文本主題模型306
8.6.2 情感分析模型309
習(xí)題311
參考文獻(xiàn)312