《機器學(xué)習(xí)從線性回歸到大模型》以回歸為主線,系統(tǒng)介紹統(tǒng)計學(xué)、機器學(xué)習(xí)與深度學(xué)習(xí)中最常用的分類與回歸方法,力圖在大數(shù)據(jù)與人工智能背景下,突破傳統(tǒng)統(tǒng)計建模的局限,構(gòu)建一個融合多學(xué)科視角的現(xiàn)代回歸分析框架。
全書覆蓋線性回歸、嶺回歸、Lasso、Logistic回歸等經(jīng)典線性模型,決策樹、隨機森林、GBDT、XGBoost等集成方法,BP神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)模型,以及基于Transformer的大語言模型(如BERT和GPT)。 此外,《機器學(xué)習(xí)從線性回歸到大模型》還介紹因果推斷方法、模型可解釋性工具(如SHAP)與遷移學(xué)習(xí)等前沿技術(shù),強調(diào)跨學(xué)科融合,關(guān)注算法應(yīng)用場景. 書中穿插算法發(fā)展史,展現(xiàn)行業(yè)應(yīng)用,聚焦人工智能在中國的發(fā)展脈絡(luò),增強學(xué)生的責(zé)任意識與現(xiàn)實關(guān)懷。
《機器學(xué)習(xí)從線性回歸到大模型》配套案例涵蓋農(nóng)業(yè)、醫(yī)學(xué)等領(lǐng)域,以場景建模為理念,展現(xiàn)模型與國家、行業(yè)需求緊密結(jié)合的完整建模流程。 配套習(xí)題涵蓋風(fēng)控、幸福感預(yù)測、圖像識別、視頻生成等主題,具有實踐性和挑戰(zhàn)性,有助于培養(yǎng)實戰(zhàn)能力。
《機器學(xué)習(xí)從線性回歸到大模型》算法基于Python實現(xiàn),深度學(xué)習(xí)部分使用TensorFlow與Keras框架,配套提供案例和習(xí)題數(shù)據(jù)集、案例源代碼,便于教學(xué)和自學(xué)使用。
《機器學(xué)習(xí)從線性回歸到大模型》適用于統(tǒng)計、數(shù)據(jù)科學(xué)、人工智能、經(jīng)濟管理等專業(yè)的本科生與研究生,可作為回歸分析統(tǒng)計模型機器學(xué)習(xí)等課程教材,也可作為人工智能通識教材使用,同時可供數(shù)據(jù)分析相關(guān)從業(yè)者參考。
本書以回歸為主線,系統(tǒng)整合統(tǒng)計學(xué)與機器學(xué)習(xí)的核心方法,從經(jīng)典線性模型延伸至大語言模型,構(gòu)建跨學(xué)科的知識體系。通過原理講解、代碼實現(xiàn)與真實案例結(jié)合,幫助讀者掌握建模思維與實踐能力,適合多學(xué)科背景學(xué)習(xí)者使用,是一本兼具深度與廣度的現(xiàn)代回歸分析指南。
董巖
----------------------------
中國科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院博士,現(xiàn)任北京理工大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院講師,碩士生導(dǎo)師。研究方向為回歸建模、機器學(xué)習(xí)。負責(zé)系統(tǒng)可靠性等研究課題。有多年一線教學(xué)經(jīng)驗,主講北京理工大學(xué)一流本科專業(yè)本科專業(yè)統(tǒng)計學(xué)核心課程線性統(tǒng)計模型,其他開設(shè)課程包括:機器學(xué)習(xí)回歸方法、概率與數(shù)理統(tǒng)計、多元分析、SPSS統(tǒng)計軟件分析等。著有數(shù)學(xué)建模教材《數(shù)學(xué)建模方法進階》(合著)。曾多次指導(dǎo)全國大學(xué)生數(shù)學(xué)建模競賽、美國大學(xué)生數(shù)學(xué)建模競賽并獲獎。
目 錄
第1章 經(jīng)典線性模型
1.1 監(jiān)督學(xué)習(xí)
1.2 分類及應(yīng)用場景
1.3 回歸及應(yīng)用場景
1.4 多元線性回歸模型
1.5 正則化線性回歸模型
1.6 Logistic 回歸模型
第2章 基于決策樹的模型
2.1 決策樹
2.2 隨機森林
2.3 因果森林
2.4 梯度提升決策樹
2.5 極端梯度提升
2.6 輕量梯度提升機
2.7 類別特征梯度提升
第3章 神經(jīng)網(wǎng)絡(luò)
3.1 人工神經(jīng)網(wǎng)絡(luò)發(fā)展史
3.2 生物神經(jīng)元與人工神經(jīng)元
3.3 激活函數(shù)
3.4 多層感知器
3.5 梯度下降優(yōu)化算法
第4章 深度學(xué)習(xí)
4.1 卷積神經(jīng)網(wǎng)絡(luò)
4.2 LeNet-5 網(wǎng)絡(luò)
4.3 AlexNet 網(wǎng)絡(luò)
4.4 批量歸一化
4.5 殘差網(wǎng)絡(luò)
4.6 語言模型與 Word2Vec 詞向量
4.7 循環(huán)神經(jīng)網(wǎng)絡(luò)
第5章 大語言模型
5.1 Transformer 模型
5.2 BERT 模型
5.3 GPT 模型
5.4 GPT-2 模型
5.5 GPT-3 模型
5.6 ChatGPT 模型
第6章 案例分析
6.1 中國糧食產(chǎn)量影響因素分析
6.2 心臟病數(shù)據(jù)分析
6.3 深度學(xué)習(xí)在阿爾茨海默病識別中的應(yīng)用