Python大模型優(yōu)化策略:理論與實(shí)踐
定 價(jià):149 元
- 作者:劉衍琦, 高超 ,閆家碩 ,賈澤豪 著
- 出版時(shí)間:2025/8/1
- ISBN:9787301362747
- 出 版 社:北京大學(xué)出版社
- 中圖法分類:TP312.8
- 頁碼:392
- 紙張:
- 版次:1
- 開本:16開
本書是一本全面介紹Python大模型優(yōu)化策略的專業(yè)書籍,旨在幫助讀者掌握如何高效訓(xùn)練、優(yōu)化、部署和調(diào)用大規(guī)模深度學(xué)習(xí)模型。掌握這些優(yōu)化技巧將是推動大模型應(yīng)用和提升AI行業(yè)競爭力的關(guān)鍵。
本書以深度學(xué)習(xí)和大模型技術(shù)為引,系統(tǒng)講解了各種優(yōu)化算法,并深入探討了兩者的融合與應(yīng)用。本書涵蓋了機(jī)器學(xué)習(xí)與深度學(xué)習(xí)概述、Transformer模型與大模型概述、模型訓(xùn)練與優(yōu)化技巧、模型調(diào)用與優(yōu)化基礎(chǔ)、大模型優(yōu)化概述、常用的優(yōu)化算法概述、遺傳算法、多目標(biāo)優(yōu)化與遺傳算法進(jìn)階、蟻群算法、鯨魚優(yōu)化算法、螢火蟲優(yōu)化算法、神經(jīng)網(wǎng)絡(luò)優(yōu)化算法、大模型與優(yōu)化應(yīng)用實(shí)踐、DeepSeek的介紹與使用等內(nèi)容,每章通過實(shí)踐練習(xí)介紹了大模型優(yōu)化的實(shí)際應(yīng)用。
本書面向具備機(jī)器學(xué)習(xí)和深度學(xué)習(xí)基礎(chǔ)的讀者,適合作為高等院校計(jì)算機(jī)相關(guān)專業(yè)的本科及?平滩。對于AI從業(yè)者、科研人員和工程師而言,本書能夠助力他們在大模型訓(xùn)練與優(yōu)化領(lǐng)域深入理解并積累實(shí)踐經(jīng)驗(yàn)。
劉衍琦, 高超 ,閆家碩 ,賈澤豪
----------------------------
劉衍琦,碩士,畢業(yè)于大連理工大學(xué)數(shù)學(xué)科學(xué)學(xué)院計(jì)算幾何與圖形圖像重點(diǎn)實(shí)驗(yàn)室,現(xiàn)為煙臺理工學(xué)院人工智能學(xué)院教師。曾在東方電子股份有限公司、中科院計(jì)算所煙臺分所任職,具有豐富的企業(yè)、研究所及高校從業(yè)經(jīng)歷。長期專注于大數(shù)據(jù)和人工智能的實(shí)踐應(yīng)用,主要研究領(lǐng)域包括機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺和自然語言處理。曾主持和參與多個科研項(xiàng)目,并授權(quán)多項(xiàng)國家專利。出版《計(jì)算機(jī)視覺與深度學(xué)習(xí)實(shí)戰(zhàn):以MATLAB、Python為工具》《PyTorch深度學(xué)習(xí)實(shí)戰(zhàn)之目標(biāo)檢測》等著作。
高超,碩士,畢業(yè)于山東大學(xué)軟件工程碩士專業(yè),F(xiàn)為山東商務(wù)職業(yè)學(xué)院專任教師。具有豐富的企業(yè)及高校從業(yè)經(jīng)歷,曾在東方電子股份有限公司、煙臺東方威斯頓電氣有限公司任職。專注于電力物聯(lián)網(wǎng)領(lǐng)域?qū)嵺`應(yīng)用,主要研究領(lǐng)域包括電力規(guī)約的解析和處理、機(jī)器視覺和視頻分析領(lǐng)域。
閆家碩,煙臺理工學(xué)院人工智能協(xié)會會長、特納科技(煙臺)有限公司 CEO。掌握人工智能技術(shù)開發(fā)。參與開發(fā)數(shù)字生命DL-A、DL-B項(xiàng)目,相關(guān)成果于 GitHub 開源并收獲 2.4k star;主持多項(xiàng)guojia級與省級重點(diǎn)科研項(xiàng)目,包括《基于YoloV9-Self Attention 的惡劣天氣輔助駕駛優(yōu)化算法》(guojia級大創(chuàng)立項(xiàng))和《鐵翼智盾——基于多模態(tài)大模型的無人機(jī)偵察與輔助決策系統(tǒng)》(山東省大學(xué)生創(chuàng)新大賽銀獎);帶領(lǐng)團(tuán)隊(duì)開發(fā)的《云行衛(wèi)道》項(xiàng)目在創(chuàng)客營競賽中榮獲第一名;參與研發(fā)《雷視特偵》自主式電力設(shè)備AI巡檢機(jī)器人項(xiàng)目,獲山東省高校智能機(jī)器人創(chuàng)意競賽二等獎。個人榮獲guojia級獎項(xiàng)2項(xiàng)、省級獎項(xiàng)6項(xiàng)。
賈澤豪,煙臺理工學(xué)院人工智能學(xué)院AI創(chuàng)新團(tuán)隊(duì)核心成員,主要研究領(lǐng)域包括計(jì)算機(jī)視覺、序列預(yù)測等。參與多個科研項(xiàng)目,發(fā)表數(shù)篇國際學(xué)術(shù)論文;榮獲4項(xiàng)人工智能領(lǐng)域guojia級賽事獎項(xiàng);發(fā)表軟件著作權(quán)2項(xiàng);參與多項(xiàng)圖書編著工作,其中主編教材1冊,副主編教材1冊;CSDN人工智能領(lǐng)域新星作者,累積文章閱讀量超百萬。
第1章機(jī)器學(xué)習(xí)和深度學(xué)習(xí)概述
1.1機(jī)器學(xué)習(xí)概述002
1.1.1機(jī)器學(xué)習(xí)的定義和基本概念002
1.1.2機(jī)器學(xué)習(xí)的分類002
1.1.3機(jī)器學(xué)習(xí)的應(yīng)用領(lǐng)域004
1.1.4機(jī)器學(xué)習(xí)的基本流程005
1.1.5常見的機(jī)器學(xué)習(xí)算法006
1.2深度學(xué)習(xí)基礎(chǔ)007
1.2.1深度學(xué)習(xí)的基本概念008
1.2.2神經(jīng)網(wǎng)絡(luò)的基本原理010
1.2.3常見的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)014
1.2.4深度學(xué)習(xí)的實(shí)際應(yīng)用015
1.2.5深度學(xué)習(xí)的挑戰(zhàn)與未來發(fā)展017
1.3實(shí)踐練習(xí):用Scikit-learn和PyTorch實(shí)現(xiàn)基礎(chǔ)模型017
1.3.1用Scikit-learn實(shí)現(xiàn)基礎(chǔ)機(jī)器學(xué)習(xí)模型017
1.3.2用PyTorch實(shí)現(xiàn)基礎(chǔ)深度學(xué)習(xí)模型020
1.4Python語言實(shí)現(xiàn):簡化的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型024
1.4.1簡化的機(jī)器學(xué)習(xí)模型024
1.4.2簡化的深度學(xué)習(xí)模型026
第2章Transformer模型與大模型概述
2.1Transformer模型的基本原理031
2.1.1自注意力機(jī)制031
2.1.2多頭自注意力機(jī)制036
2.1.3位置編碼038
2.2編碼器和解碼器結(jié)構(gòu)039
2.2.1編碼器040
2.2.2解碼器043
2.3大模型的定義與應(yīng)用047
2.3.1大模型的定義047
2.3.2大模型的應(yīng)用047
2.4實(shí)踐練習(xí):用HuggingFaceTransformers庫進(jìn)行文本生成049
2.5Python語言實(shí)現(xiàn):NLP和圖像處理中的Transformer模型應(yīng)用051
第3章模型訓(xùn)練與優(yōu)化技巧
3.1學(xué)習(xí)率調(diào)度策略059
3.1.1學(xué)習(xí)率059
3.1.2學(xué)習(xí)率的調(diào)整策略060
3.2早停策略064
3.2.1過擬合064
3.2.2運(yùn)用早停策略防止過擬合066
3.3正則化070
3.3.1L1正則化070
3.3.2L2正則化071
3.3.3Dropout正則化072
3.3.3Dropout正則化072
3.4批標(biāo)準(zhǔn)化074
3.5模型參數(shù)初始化技巧076
3.6實(shí)踐練習(xí):用Python語言實(shí)現(xiàn)高效訓(xùn)練策略077
3.7Python語言實(shí)現(xiàn):優(yōu)化技巧在模型訓(xùn)練中的應(yīng)用079
第4章模型調(diào)用與優(yōu)化基礎(chǔ)
4.1模型調(diào)用概述086
4.1.1模型調(diào)用的步驟086
4.1.2大模型調(diào)用的分類088
4.1.3大模型調(diào)用平臺090
4.2大模型的選擇與量化091
4.2.1選擇適合的模型091
4.2.2模型量化092
4.3遷移學(xué)習(xí)基礎(chǔ)094
4.3.1基本概念與發(fā)展背景095
4.3.2工作原理與分類096
4.3.3大模型的微調(diào)096
4.4實(shí)踐練習(xí):用Transformers庫調(diào)用預(yù)訓(xùn)練模型099
4.5Python語言實(shí)現(xiàn):利用預(yù)訓(xùn)練模型進(jìn)行基礎(chǔ)應(yīng)用104
第5章大模型優(yōu)化概述
5.1大模型優(yōu)化的基本概念109
5.1.1大模型的定義與背景109
5.1.2大模型在實(shí)際應(yīng)用中的挑戰(zhàn)112
5.1.3大模型優(yōu)化的核心問題115
5.2梯度下降法及其變種118
5.2.1梯度下降法的基本原理119
5.2.2隨機(jī)梯度下降法121
5.2.3動量法122
5.2.4AdaGrad、RMSProp與Adam123
5.3超參數(shù)優(yōu)化125
5.3.1超參數(shù)的定義與重要性126
5.3.2常見的超參數(shù)優(yōu)化方法127
5.4實(shí)踐練習(xí):用Python語言實(shí)現(xiàn)梯度下降法129
5.5Python語言實(shí)現(xiàn):優(yōu)化算法在圖像分類中的應(yīng)用示例132
第6章常用的優(yōu)化算法概述
6.1進(jìn)化算法138
6.1.1進(jìn)化類算法的基本概念138
6.1.2遺傳算法139
6.1.3差分進(jìn)化算法148
6.2生物智能算法框架150
6.2.1生物智能算法簡介150
6.2.2典型生物智能算法151
6.2.3算法性能分析153
6.3智能搜索算法框架155
6.3.1智能搜索算法概述156
6.3.2典型的智能搜索算法157
6.4神經(jīng)網(wǎng)絡(luò)算法框架159
6.4.1神經(jīng)網(wǎng)絡(luò)的基本概念160
6.4.2常見的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)162
6.4.2常見的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)162
6.5實(shí)踐練習(xí):用Python完成元啟發(fā)式約束優(yōu)化164
6.6Python語言實(shí)現(xiàn):約束尋優(yōu)問題168
第7章遺傳算法
7.1遺傳算法簡介173
7.1.1遺傳算法的定義與核心概念173
7.1.2遺傳算法的基本原理與機(jī)制175
7.2選擇、交叉和變異操作176
7.2.1選擇操作177
7.2.2交叉操作179
7.2.3變異操作181
7.3適應(yīng)度函數(shù)設(shè)計(jì)183
7.3.1適應(yīng)度函數(shù)的定義183
7.3.2適應(yīng)度函數(shù)的構(gòu)建方法186
7.3.3適應(yīng)度評價(jià)與選擇方法187
7.4實(shí)踐練習(xí):實(shí)現(xiàn)一個簡單的遺傳算法1897.5Python語言實(shí)現(xiàn):TSP194
第8章多目標(biāo)優(yōu)化與遺傳算法進(jìn)階
8.1多目標(biāo)優(yōu)化簡介203
8.1.1多目標(biāo)優(yōu)化的基本概念與理論基礎(chǔ)203
8.1.2多目標(biāo)優(yōu)化的應(yīng)用領(lǐng)域與挑戰(zhàn)206
8.2遺傳算法在實(shí)際問題中的應(yīng)用(TSP)209
8.2.1TSP介紹209
8.2.2遺傳算法在旅行商問題中的應(yīng)用211
8.2.3遺傳算法在多目標(biāo)TSP中的實(shí)現(xiàn)策略213
8.3遺傳算法的性能調(diào)優(yōu)215
8.3.1遺傳算法的參數(shù)調(diào)優(yōu)215
8.3.2并行計(jì)算在遺傳算法中的應(yīng)用217
8.4實(shí)踐練習(xí):實(shí)現(xiàn)一個簡單的多目標(biāo)遺傳算法220
8.5Python代碼實(shí)現(xiàn):多目標(biāo)優(yōu)化和遺傳算法性能調(diào)優(yōu)226
第9章蟻群算法
9.1蟻群算法簡介233
9.1.1蟻群算法的基本概念233
9.1.2蟻群算法應(yīng)用場景235
9.2信息素更新機(jī)制236
9.2.1信息素的作用與初始化237
9.2.2信息素?fù)]發(fā)與更新規(guī)則239
9.2.3啟發(fā)式因子與路徑選擇規(guī)則242
9.3蟻群算法在路徑優(yōu)化中的應(yīng)用244
9.3.1TSP的優(yōu)化方法244
9.3.2應(yīng)用中的挑戰(zhàn)與優(yōu)化策略246
9.4實(shí)踐練習(xí):實(shí)現(xiàn)一個簡單的蟻群算法248
9.5Python語言實(shí)現(xiàn):蟻群算法252
第10章鯨魚優(yōu)化算法
10.1鯨魚優(yōu)化算法簡介258
10.2模擬鯨魚覓食行為259
10.2.1螺旋更新機(jī)制259
10.2.2收縮包圍機(jī)制 261
10.2.3全局搜索與局部開發(fā)的平衡264
10.3算法優(yōu)化與應(yīng)用267
10.3.1鯨魚優(yōu)化算法的優(yōu)缺點(diǎn)分析267
10.3.2提高算法性能的常用方法270
10.3.3鯨魚優(yōu)化算法的擴(kuò)展與應(yīng)用274
10.4實(shí)踐練習(xí):實(shí)現(xiàn)一個簡單的鯨魚優(yōu)化算法276
10.5Python語言實(shí)現(xiàn):鯨魚優(yōu)化算法278
第11章螢火蟲優(yōu)化算法
11.1螢火蟲優(yōu)化算法簡介284
11.1.1螢火蟲優(yōu)化算法的背景和原理284
11.1.2螢火蟲優(yōu)化算法的核心思想285
11.2吸引力函數(shù)和位置更新機(jī)制288
11.2.1吸引力函數(shù)的定義288
11.2.2位置更新機(jī)制290
11.2.3算法流程293
11.3算法優(yōu)化與應(yīng)用295
11.3.1參數(shù)優(yōu)化295
11.3.2實(shí)際應(yīng)用298
11.4實(shí)踐練習(xí):實(shí)現(xiàn)螢火蟲優(yōu)化算法30111.5Python語言實(shí)現(xiàn)與案例分析308
第12章神經(jīng)網(wǎng)絡(luò)優(yōu)化算法
12.1神經(jīng)網(wǎng)絡(luò)優(yōu)化算法簡介317
12.1.1神經(jīng)網(wǎng)絡(luò)簡介317
12.1.2優(yōu)化算法簡介319
12.2梯度下降與訓(xùn)練321
12.2.1前向傳播與損失函數(shù)321
12.2.2反向傳播322
12.2.3梯度下降324
12.3算法優(yōu)化與應(yīng)用328
12.3.1Momentum優(yōu)化算法328
12.3.2RMSprop優(yōu)化算法329
12.3.3Adam優(yōu)化算法330
12.3.4AdamW優(yōu)化算法331
12.4實(shí)踐練習(xí):實(shí)現(xiàn)一個簡單的神經(jīng)網(wǎng)絡(luò)優(yōu)化算法332
12.5Python語言實(shí)現(xiàn):神經(jīng)網(wǎng)絡(luò)優(yōu)化算法336
第13章大模型與優(yōu)化應(yīng)用實(shí)踐
13.1大模型的可解釋性與安全性342
13.1.1大模型的可解釋性342
13.1.2大模型的安全性344
13.2大模型的前沿研究與未來發(fā)展346
13.2.1大模型當(dāng)前的技術(shù)進(jìn)展346
13.2.2技術(shù)挑戰(zhàn)349
13.3大模型微調(diào)技術(shù)351
13.3.1微調(diào)的必要性352
13.3.2微調(diào)方法354
13.4大模型性能優(yōu)化技巧356
13.4.1模型優(yōu)化的基本策略357
13.4.2硬件加速359
13.5大模型在優(yōu)化項(xiàng)目中的應(yīng)用359
13.5.1實(shí)際應(yīng)用359
13.5.2優(yōu)化求解361
13.6實(shí)踐練習(xí):用HuggingFaceTransformers庫進(jìn)行大模型微調(diào)并應(yīng)用于優(yōu)化項(xiàng)目361
13.7Python語言實(shí)現(xiàn):大模型微調(diào)及其在特定領(lǐng)域優(yōu)化中的應(yīng)用366
第14章DeepSeek的介紹與使用
14.1DeepSeek的簡介372
14.1.1什么是DeepSeek372
14.1.2為什么選擇DeepSeek372
14.1.3如何使用DeepSeek373
14.2DeepSeek的使用技巧374
14.2.1選擇適合的模型374
14.2.2聯(lián)網(wǎng)搜索375
14.2.3提問技巧375
14.3DeepSeek的應(yīng)用集成376
14.3.1申請APIkey376
14.3.2將DeepSeek接入PyCharm377
14.3.3DeepSeek與Cline結(jié)合377
14.4實(shí)踐練習(xí):DeepSeek實(shí)現(xiàn)游戲代碼開發(fā)378
14.5Python語言實(shí)現(xiàn):DeepSeekAPI調(diào)用379