本書(shū)旨在為讀者提供一本實(shí)用的指南,幫助他們運(yùn)用現(xiàn)代技術(shù)深入探索金融數(shù)據(jù)領(lǐng)域。
本書(shū)以 Python 為主要編程語(yǔ)言,結(jié)合實(shí)例和 ChatGPT 的協(xié)助,詳細(xì)介紹了從獲取金融數(shù)據(jù)到數(shù)據(jù)處理、數(shù)據(jù)可視化、探索、建模,再到機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等的應(yīng)用,并且探討了生成式 AI 在選股和分配權(quán)重方面的潛在應(yīng)用,為讀者打開(kāi)了金融領(lǐng)域未來(lái)的一扇新窗。除了提供全面的理論知識(shí)
和實(shí)用技術(shù)指導(dǎo),本書(shū)還附贈(zèng)了大量高質(zhì)量的金融數(shù)據(jù),可供讀者在不方便調(diào)用接口時(shí)下載和使用。
本書(shū)主要面向金融從業(yè)人員,或者對(duì)金融和數(shù)據(jù)分析感興趣的讀者。
1.金融大數(shù)據(jù)分析新模式:讓金融大數(shù)據(jù)分析更高效、更快捷、更完美。
2.全流程解析:涵蓋獲取金融數(shù)據(jù)到數(shù)據(jù)處理、數(shù)據(jù)可視化、探索、建模,再到機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等全流程應(yīng)用。
3.實(shí)戰(zhàn)檢驗(yàn):ChatGPT結(jié)合多種金融大數(shù)據(jù)分析工具及案例實(shí)操講解,理解更加透徹。
4.快速提高金融大數(shù)據(jù)分析效率:揭秘ChatGPT與金融大數(shù)據(jù)分析高效融合的核心方法論和實(shí)踐經(jīng)驗(yàn)。
親愛(ài)的讀者朋友,非常感謝您選擇本書(shū)!在這里,我想和大家聊一聊這本書(shū)的寫(xiě)作背景、寫(xiě)作過(guò)程以及價(jià)值。
有那么一段時(shí)間,一些從事金融工作的朋友時(shí)不時(shí)向我抱怨,他們需要在繁忙的工作之余學(xué)習(xí)編程語(yǔ)言,以便更好地處理和分析金融數(shù)據(jù)。我深知這種挑戰(zhàn)非常困難,因此,寫(xiě)這本書(shū)的初衷是幫助金融從業(yè)者快速掌握 Python 在金融數(shù)據(jù)分析中的應(yīng)用技能,減輕他們的工作負(fù)擔(dān)。而隨著 AI技術(shù)的飛速發(fā)展,AI 大模型的出現(xiàn)為這一目標(biāo)的實(shí)現(xiàn)提供了前所未有的可能性。
AI 大模型,如 ChatGPT,以及以文心一言、訊飛星火認(rèn)知大模型等為代表的國(guó)產(chǎn)大模型等,
都具有強(qiáng)大的自然語(yǔ)言處理能力,可以根據(jù)用戶(hù)的自然語(yǔ)言提示生成相應(yīng)的代碼。這一特性使得
金融從業(yè)人員只需有一點(diǎn)編程基礎(chǔ),就可以通過(guò)簡(jiǎn)單的自然語(yǔ)言描述,快速生成用于數(shù)據(jù)分析的
Python 代碼。這無(wú)疑極大地降低了數(shù)據(jù)分析的門(mén)檻,讓更多的人能夠輕松地掌握這一技能。
當(dāng)然,要使用 AI 大模型生成 Python 代碼,高質(zhì)量的提示詞至關(guān)重要。在寫(xiě)作本書(shū)的過(guò)程中,我也不斷嘗試調(diào)整提示詞,以便讓 AI 大模型生成的代碼能夠順利運(yùn)行并實(shí)現(xiàn)我所期待的結(jié)果。通過(guò)持續(xù)實(shí)驗(yàn),我總結(jié)出一些經(jīng)驗(yàn)和大家進(jìn)行分享。
首先,我們要明確想要 AI 大模型生成的代碼實(shí)現(xiàn)什么功能,是進(jìn)行數(shù)據(jù)清洗、特征工程、模型訓(xùn)練,還是進(jìn)行預(yù)測(cè)?我們要確保提示詞清晰地描述了這一目標(biāo)。
其次,對(duì)于重要的步驟和邏輯,提供足夠的細(xì)節(jié)。例如,如果我們想生成一段用于數(shù)據(jù)分區(qū)的代碼,可以這樣寫(xiě):請(qǐng)將數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,比例為 70% 和 30%。
再次,我們要確保提示詞沒(méi)有歧義,以免導(dǎo)致生成的代碼不符合預(yù)期。例如,不要簡(jiǎn)單地寫(xiě)生成一個(gè)循環(huán),而要明確循環(huán)的次數(shù)、條件等細(xì)節(jié)。
最后,我們要確保使用正確的專(zhuān)業(yè)詞匯,從而讓 AI 大模型更準(zhǔn)確地理解我們的需求,并提高代碼的質(zhì)量。
需要強(qiáng)調(diào)的是,在每次生成代碼之后,都要進(jìn)行測(cè)試,確保其滿(mǎn)足我們的需求。根據(jù)測(cè)試結(jié)果,對(duì)提示詞進(jìn)行微調(diào),逐步優(yōu)化生成的代碼。
舉個(gè)例子,假設(shè)我們想生成一段用于計(jì)算股票收益率的 Python 代碼,可以這樣寫(xiě)提示詞:請(qǐng)
編寫(xiě)一個(gè) Python 腳本,從 CSV 文件中的收盤(pán)價(jià)列讀取股票的價(jià)格數(shù)據(jù),計(jì)算每日收益率,并將結(jié)果保存為新的 CSV 文件。這樣的提示詞既明確了目標(biāo)(計(jì)算收益率并保存結(jié)果),也提供了足夠的細(xì)節(jié)(從 CSV 文件中的特定列讀取價(jià)格數(shù)據(jù)、計(jì)算每日收益率等)。
寫(xiě)出高質(zhì)量的提示詞需要一定的經(jīng)驗(yàn)積累。通過(guò)不斷測(cè)試和反饋,相信大家很快就能夠熟練地運(yùn)用這一技能,快速獲得滿(mǎn)足需求的 Python 代碼。
本書(shū)將手把手教讀者利用精確詳細(xì)的提示詞,讓大語(yǔ)言模型生成可用性極高的金融數(shù)據(jù)分析與建模代碼。此外,本書(shū)不僅僅涉及經(jīng)典的金融數(shù)據(jù)分析理論與模型,還引入了目前大語(yǔ)言模型在投資組合選股方面的最新研究,旨在幫助讀者拓寬視野,為適應(yīng) AI 時(shí)代的工作方法打下基礎(chǔ)。
在編寫(xiě)本書(shū)的過(guò)程中,我深感責(zé)任重大,所以試圖竭盡所能地為讀者呈現(xiàn)最全面實(shí)用的知識(shí),
但由于計(jì)算機(jī)技術(shù)發(fā)展迅速,書(shū)中難免有疏漏和不妥之處,敬請(qǐng)廣大讀者不吝指正。如果大家在學(xué)習(xí)過(guò)程中遇到問(wèn)題,歡迎添加我的個(gè)人微信dynhyper,我將盡力為大家進(jìn)行解答。
本書(shū)贈(zèng)送全書(shū)案例源代碼及相關(guān)數(shù)據(jù)資源,讀者可掃描下方二維碼關(guān)注博雅讀書(shū)社微信公眾號(hào),輸入本書(shū) 77 頁(yè)的資源下載碼,即可獲得本書(shū)的下載學(xué)習(xí)資源。
最后,衷心祝愿讀者朋友在金融數(shù)據(jù)分析領(lǐng)域取得更大的成就,實(shí)現(xiàn)自己的職業(yè)發(fā)展目標(biāo)。同
時(shí),也讓我們一起迎接 AI 大模型帶來(lái)的新挑戰(zhàn)與新機(jī)遇,共同邁向數(shù)據(jù)驅(qū)動(dòng)的新未來(lái)!
段小手
段小手,曾供職于百度、敦煌網(wǎng)、慧聰網(wǎng)、方正集團(tuán)等知名IT企業(yè)。有多年的科技項(xiàng)目管理及開(kāi)發(fā)經(jīng)驗(yàn)。2019年至今,與云南省公安廳合作數(shù)據(jù)挖掘項(xiàng)目,使用機(jī)器學(xué)習(xí)技術(shù)協(xié)助云南警方打擊違法犯罪活動(dòng),有效將某類(lèi)案件發(fā)案率大幅降低。
其負(fù)責(zé)的項(xiàng)目曾獲得國(guó)家發(fā)改委電子商務(wù)示范項(xiàng)目中關(guān)村現(xiàn)代服務(wù)業(yè)試點(diǎn)項(xiàng)目北京市信息化基礎(chǔ)設(shè)施提升專(zhuān)項(xiàng)北京市外貿(mào)公共服務(wù)平臺(tái)等多項(xiàng)政策支持。出版《用ChatGPT輕松玩轉(zhuǎn)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)》《深度學(xué)習(xí)與大模型基礎(chǔ)》等著作,廣受讀者歡迎。
第1章
用Python獲取金融數(shù)據(jù)/ 1
1.1獲取股票數(shù)據(jù)2
1.1.1獲取股票實(shí)時(shí)行情數(shù)據(jù)2
1.1.2獲取股票歷史行情數(shù)據(jù)4
1.1.3獲取上市公司財(cái)務(wù)指標(biāo)數(shù)據(jù).5
1.2獲取期貨數(shù)據(jù)8
1.2.1獲取期貨手續(xù)費(fèi)與保證金數(shù)據(jù)8
1.2.2獲取期貨實(shí)時(shí)行情數(shù)據(jù)10
1.2.3獲取期貨歷史行情數(shù)據(jù)11
1.3獲取宏觀數(shù)據(jù)12
1.3.1獲取國(guó)內(nèi)生產(chǎn)總值數(shù)據(jù)12
1.3.2獲取社會(huì)融資規(guī)模增量統(tǒng)計(jì)數(shù)據(jù)14
1.3.3獲取M2貨幣供應(yīng)年率數(shù)據(jù).15
1.4小結(jié)與習(xí)題.15
第2章
讓ChatGPT協(xié)助處理金融數(shù)據(jù)/ 17
2.1將價(jià)格數(shù)據(jù)轉(zhuǎn)化為收益.18
2.1.1讓ChatGPT協(xié)助計(jì)算簡(jiǎn)單收益18
2.1.2讓ChatGPT協(xié)助計(jì)算對(duì)數(shù)收益20
2.2根據(jù)通貨膨脹調(diào)整收益.21
2.2.1通貨膨脹調(diào)整的一般步驟.22
2.2.2獲取CPI月率數(shù)據(jù)并進(jìn)行處理.23
2.2.3讓ChatGPT協(xié)助進(jìn)行通貨膨脹調(diào)整24
2.3實(shí)現(xiàn)波動(dòng)率的計(jì)算.26
2.3.1實(shí)現(xiàn)波動(dòng)率的原理與公式.26
2.3.2計(jì)算股價(jià)的月度實(shí)現(xiàn)波動(dòng)率.27
2.3.3讓ChatGPT協(xié)助計(jì)算年化實(shí)現(xiàn)波動(dòng)率28
2.4缺失數(shù)據(jù)填補(bǔ)31
2.4.1用reindex填補(bǔ)缺失的日期.31
2.4.2讓ChatGPT協(xié)助填充缺失數(shù)據(jù)32
2.4.3讓ChatGPT協(xié)助用插值法填充缺失數(shù)據(jù)33
2.5小結(jié)與習(xí)題.35
......
第15章
利用生成式AI進(jìn)行選股和分配權(quán)重 311
15.1生成式AI用于投資組合選擇的研究312
15.1.1生成式AI與其幻覺(jué)312
15.1.2生成式AI與大語(yǔ)言模型314
15.2使用大語(yǔ)言模型薦股.315
15.2.1領(lǐng)先基金的投資原則315
15.2.2宏觀經(jīng)濟(jì)形勢(shì)分析.317
15.2.3根據(jù)經(jīng)濟(jì)形勢(shì)研判進(jìn)行股票選擇319
15.3為投資組合分配權(quán)重.323
15.3.1 ChatGPT提供的權(quán)重分配323
15.3.2使用傳統(tǒng)優(yōu)化方法計(jì)算權(quán)重分配326
15.3.3文心一言提供的權(quán)重分配.328
15.4小結(jié)與習(xí)題.332
結(jié)束語(yǔ)/ 333