為了響應(yīng)國家健康發(fā)展人工智能技術(shù)的戰(zhàn)略,針對國家、社會、個人對于提高機(jī)器學(xué)習(xí)安全與數(shù)據(jù)隱私保護(hù)的迫切需求,本書聚焦機(jī)器學(xué)習(xí)攻防對抗問題,根據(jù)機(jī)器學(xué)習(xí)的生命周期系統(tǒng)梳理了包括模型訓(xùn)練、模型推理、算法實踐3個階段的安全與隱私相關(guān)問題,并深入探討了常見的攻防對抗場景及對應(yīng)場景面臨的安全威脅與隱私風(fēng)險,如數(shù)據(jù)隱私泄露、模型后門攻擊等。此外,本書還展望了提升模型安全性的可行方案,為讀者提供了理論與實踐結(jié)合的全面視角。
本書可供網(wǎng)絡(luò)空間安全、計算機(jī)科學(xué)與技術(shù)、人工智能等相關(guān)專業(yè)的高年級本科生和研究生閱讀,尤其適合具備機(jī)器學(xué)習(xí)、深度神經(jīng)網(wǎng)絡(luò)、網(wǎng)絡(luò)安全等基礎(chǔ)知識的讀者。
1、本書聚焦機(jī)器學(xué)習(xí)攻防對抗問題,根據(jù)機(jī)器學(xué)習(xí)的生命周期系統(tǒng)梳理了包括模型訓(xùn)練、模型推理、算法實踐3個階段的安全與隱私相關(guān)問題;
2、本書深入探討了常見的攻防對抗場景及對應(yīng)場景面臨的安全威脅與隱私風(fēng)險,如數(shù)據(jù)隱私泄露、模型后門攻擊等;
3、本書還展望了提升模型安全性的可行方案,提供了豐富的實戰(zhàn)案例和理論分析,為讀者提供了理論與實踐結(jié)合的全面視角。
沈超,西安交通大學(xué)二級教授,教育部長江學(xué)者特聘教授,國家自然科學(xué)基金委創(chuàng)新群體B負(fù)責(zé)人,教育部創(chuàng)新團(tuán)隊負(fù)責(zé)人,科學(xué)探索獎、達(dá)摩院青橙獎、基金委優(yōu)青獲得者,信息物理融合系統(tǒng)教育部工程研究中心主任,國家重點研發(fā)計劃首席科學(xué)家,國家基礎(chǔ)加強(qiáng)計劃技術(shù)首席科學(xué)家,國家重點研發(fā)計劃“先進(jìn)計算與新興軟件”重點專項指南專家組成員,麻省理工MIT TR35 China、霍英東青年教師一等獎、IEEE SMC Early Career Award、陜西省青年五四獎?wù)芦@得者。主要從事智能系統(tǒng)安全與控制、人工智能可信與安全、智能軟硬件測試的研究,在IEEE S&P、ACM CCS、USENIX Security、ICSE、ASE、ICML、NIPS等計算機(jī)和自動化領(lǐng)域的學(xué)術(shù)刊物上發(fā)表論文100余篇,獲學(xué)術(shù)會議最佳論文獎12項,2021—2025年連續(xù)5年入選全球前2%頂尖科學(xué)家榜單。
第 1章 對抗性機(jī)器學(xué)習(xí)基礎(chǔ)知識 001
1.1 監(jiān)督學(xué)習(xí) 002
1.1.1 分類 002
1.1.2 回歸 004
1.1.3 對抗環(huán)境中的監(jiān)督學(xué)習(xí) 006
1.2 無監(jiān)督學(xué)習(xí) 006
1.2.1 聚類 007
1.2.2 降維 009
1.2.3 對抗環(huán)境中的無監(jiān)督學(xué)習(xí) 011
1.3 半監(jiān)督學(xué)習(xí) 011
1.3.1 半監(jiān)督學(xué)習(xí)的3個基本假設(shè) 011
1.3.2 半監(jiān)督學(xué)習(xí)在分類和回歸兩種場景下的應(yīng)用 012
1.4 強(qiáng)化學(xué)習(xí) 012
1.4.1 強(qiáng)化學(xué)習(xí)概述 013
1.4.2 有模型學(xué)習(xí) 016
1.4.3 基于學(xué)習(xí)的預(yù)測 018
1.4.4 對抗環(huán)境中的強(qiáng)化學(xué)習(xí) 023
1.5 深度學(xué)習(xí) 023
1.5.1 多層感知器 024
1.5.2 卷積神經(jīng)網(wǎng)絡(luò) 025
1.5.3 循環(huán)神經(jīng)網(wǎng)絡(luò) 026
1.5.4 對抗環(huán)境中的深度學(xué)習(xí) 027
1.6 本章小結(jié) 029
參考文獻(xiàn) 029
第 2章 對抗性機(jī)器學(xué)習(xí)與隱私攻防 032
2.1 對抗與隱私攻擊分類 032
2.1.1 對抗性攻擊 032
2.1.2 對抗性機(jī)器學(xué)習(xí)與隱私攻擊場景 033
2.1.3 訓(xùn)練階段的攻擊 037
2.1.4 推理階段的攻擊 038
2.2 對抗與隱私防御分類 040
2.2.1 對抗性防御 040
2.2.2 對抗性機(jī)器學(xué)習(xí)防御場景 041
2.2.3 訓(xùn)練階段攻擊防御 043
2.2.4 推理階段攻擊防御 045
2.3 本章小結(jié) 047
參考文獻(xiàn) 048
第3章 訓(xùn)練階段的攻擊 054
3.1 數(shù)據(jù)投毒攻擊 054
3.1.1 數(shù)據(jù)投毒攻擊概述 055
3.1.2 破壞可用性目標(biāo)的數(shù)據(jù)投毒攻擊 056
3.1.3 破壞完整性目標(biāo)的數(shù)據(jù)投毒攻擊 062
3.2 模型投毒攻擊 066
3.2.1 模型投毒攻擊概述 066
3.2.2 模型更新投毒攻擊 067
3.2.3 聯(lián)邦數(shù)據(jù)投毒攻擊 072
3.3 模型后門攻擊 076
3.3.1 模型后門攻擊概述 077
3.3.2 模型后門觸發(fā)器 079
3.3.3 模型后門訓(xùn)練數(shù)據(jù)集 082
3.3.4 模型后門植入階段 084
3.4 本章小結(jié) 086
參考文獻(xiàn) 086
第4章 訓(xùn)練階段的防御 089
4.1 數(shù)據(jù)投毒防御 089
4.1.1 數(shù)據(jù)投毒防御概述 090
4.1.2 數(shù)據(jù)投毒檢測 091
4.1.3 數(shù)據(jù)投毒修復(fù) 093
4.2 模型投毒防御 095
4.2.1 魯棒性聯(lián)邦學(xué)習(xí)聚合算法 095
4.2.2 魯棒性聯(lián)邦學(xué)習(xí)協(xié)議 097
4.3 模型后門防御 099
4.3.1 模型后門防御概述 099
4.3.2 基于模型輸入的防御方法 100
4.3.3 基于模型參數(shù)的防御方法 103
4.4 本章小結(jié) 105
參考文獻(xiàn) 106
第5章 推理階段的攻擊 109
5.1 數(shù)字域?qū)构? 109
5.1.1 數(shù)字域白盒對抗攻擊 110
5.1.2 數(shù)字域黑盒對抗攻擊 116
5.2 物理域?qū)构? 123
5.2.1 物理域?qū)构舾攀? 124
5.2.2 物理域?qū)构舴椒? 124
5.3 隱私攻擊 132
5.3.1 模型逆向攻擊 133
5.3.2 成員推理攻擊 137
5.3.3 模型竊取攻擊 141
5.4 本章小結(jié) 144
參考文獻(xiàn) 145
第6章 推理階段的防御 148
6.1 數(shù)字域?qū)构舴烙? 148
6.1.1 基于修改輸入的對抗攻擊防御 149
6.1.2 基于修改網(wǎng)絡(luò)結(jié)構(gòu)的對抗攻擊防御 150
6.1.3 基于訓(xùn)練過程的對抗攻擊防御 151
6.1.4 基于對抗樣本檢測的對抗攻擊防御 153
6.1.5 數(shù)字域?qū)构舴烙渌侄? 155
6.2 物理域?qū)构舴烙? 155
6.2.1 物理域?qū)构舻奶厥庑? 156
6.2.2 物理域?qū)构舴烙椒? 158
6.3 隱私攻擊防御 160
6.3.1 模型堆疊 161
6.3.2 模型水印 163
6.3.3 差分隱私 166
6.4 本章小結(jié) 171
參考文獻(xiàn) 172
第7章 對抗性機(jī)器學(xué)習(xí)算法實踐 174
7.1 機(jī)器學(xué)習(xí)可解釋性 174
7.1.1 內(nèi)生可解釋性 175
7.1.2 后置可解釋性 176
7.1.3 可解釋性的應(yīng)用 178
7.2 機(jī)器學(xué)習(xí)公平性 179
7.2.1 公平性準(zhǔn)則 179
7.2.2 公平性測試 182
7.2.3 公平性修復(fù) 184
7.3 機(jī)器學(xué)習(xí)框架漏洞 185
7.3.1 機(jī)器學(xué)習(xí)框架性能漏洞 187
7.3.2 機(jī)器學(xué)習(xí)框架環(huán)境漏洞 188
7.3.3 機(jī)器學(xué)習(xí)框架功能漏洞 189
7.4 深度偽造生成 191
7.4.1 深度偽造生成概述 191
7.4.2 深度偽造人臉生成 192
7.4.3 文本內(nèi)容生成 196
7.5 深度偽造檢測 198
7.5.1 深度偽造檢測概述 198
7.5.2 深度偽造人臉檢測 199
7.5.3 生成文本檢測 202
7.6 本章小結(jié) 204
參考文獻(xiàn) 205
第8章 對抗性機(jī)器學(xué)習(xí)與安全的展望 209
8.1 訓(xùn)練階段攻擊展望 209
8.2 訓(xùn)練階段防御展望 210
8.3 推理階段攻擊展望 211
8.4 推理階段防御展望 212
8.5 對抗性機(jī)器學(xué)習(xí)展望 213
參考文獻(xiàn) 214
名詞索引 218