本書面向廣大資產(chǎn)管理者和各類研究人員,基于機器學習和人工智能,指明從一個投資理念和理論到成功的投資策略具體實施的量化途徑。作者認為一個缺乏理論依據(jù)的投資策略很可能是錯誤的。為此,資產(chǎn)管理者應致力于發(fā)展理論,而不僅是回測潛在的交易規(guī)則。本書就是從幫助資產(chǎn)管理者發(fā)現(xiàn)經(jīng)濟和金融理論的角度出發(fā),介紹機器學習的工具。機器學習不是一個黑匣子,也不一定會過擬合。機器學習的工具與經(jīng)典統(tǒng)計方法是互補關(guān)系而不是替代關(guān)系。本書認為機器學習的一些優(yōu)點包括:注重樣本外的可預測性,而不是樣本內(nèi)的方差判斷;使用計算方法避免依賴一些(或許不切實際的)假設(shè);能夠“學習”復雜的規(guī)范,包括高維空間中的非線性、分層和非連續(xù)的交互效應;能夠?qū)⒆兞克阉髋c設(shè)定搜索分離,并能很好地防止多重線性和其他替代效應。
		
	
中文版序
1   引   言 
1.1   動機 
1.2   理論很重要 
1.3   如何科學地運用機器學習 
1.4   過擬合的兩種類型 
1.5   提綱 
1.6   受眾 
1.7   關(guān)于金融機器學習的五個常見誤解 
1.8   金融研究的未來 
1.9   常見問題 
1.10   結(jié)論 
1.11   習題 
2   降噪和降調(diào) 
2.1   動機 
2.2   Marcenko-Pastur定理 
2.3   帶信號的隨機矩陣 
2.4   擬合Marcenko-Pastur分布 
2.5   降噪 
2.6   降調(diào) 
2.7   實驗結(jié)果 
2.8   結(jié)論 
2.9   習題 
3   距離度量 
3.1   動機 
3.2   基于相關(guān)性的度量 
3.3   邊際熵和聯(lián)合熵 
3.4   條件熵 
3.5   Kullback-Leibler散度 
3.6   交叉熵 
3.7   互信息 
3.8   差異信息 
3.9   離散化 
3.10   兩個劃分之間的距離 
3.11   實驗結(jié)果 
3.12   結(jié)論 
3.13   習題 
4   最優(yōu)聚類 
4.1   動機 
4.2   相似度矩陣 
4.3   聚類的類型 
4.4   類集的個數(shù) 
4.5   實驗結(jié)果 
4.6   結(jié)論 
4.7   習題 
5   金融標注 
5.1   動機 
5.2   固定區(qū)間法 
5.3   三重阻礙法 
5.4   趨勢掃描法 
5.5   元標注 
5.6   實驗結(jié)果 
5.7   結(jié)論 
5.8   習題 
6   特征重要性分析 
6.1   動機 
6.2   p值 
6.3   變量重要性 
6.4   概率加權(quán)準確度 
6.5   替代效應 
6.6   實驗結(jié)果 
6.7   結(jié)論 
6.8   習題
 
7   組合構(gòu)建 
7.1   動機 
7.2   凸組合優(yōu)化 
7.3   條件數(shù) 
7.4   Markowitz的詛咒 
7.5   信號作為協(xié)方差不穩(wěn)定性的來源 
7.6   嵌套聚類優(yōu)化算法 
7.7   實驗結(jié)果 
7.8   結(jié)論 
7.9   習題 
8   測試集過擬合 
8.1   動機 
8.2   查準率和召回率 
8.3   重復測試下的查準率和召回率 
8.4   夏普比率 
8.5   錯誤策略定理 
8.6   實驗結(jié)果 
8.7   收縮夏普比率 
8.8   家族錯誤率 
8.9   結(jié)論 
8.10   習題 
附錄A   合成數(shù)據(jù)測試 
附錄B   錯誤策略定理的證明 
參考書目 
參考文獻