金融商業(yè)數(shù)據(jù)分析:基于Python和SAS
定 價:99 元
叢書名:金融商業(yè)數(shù)據(jù)分析與應用系列
這是一本金融商業(yè)數(shù)據(jù)分析的實戰(zhàn)工具書。作者都是在金融行業(yè)有10~20年數(shù)據(jù)分析經(jīng)驗的資深專家,他們將多年來的項目經(jīng)驗、培訓和咨詢經(jīng)驗融合成了這本書。它將指導讀者零基礎掌握金融數(shù)據(jù)分析的工具、思路、方法和技巧,快速實現(xiàn)從入門到進階的突破。
本書強調實戰(zhàn),方法論與實踐相結合,所有案例均來自實際的金融業(yè)務,涵蓋工具使用、數(shù)據(jù)處理、統(tǒng)計分析等數(shù)據(jù)分析的全流程。
本書內容共14章,可分為3篇。分析工具篇(第1~4章):首先介紹了數(shù)據(jù)科學和數(shù)理統(tǒng)計的基本常識,然后講解了數(shù)據(jù)分析工具SAS EG和Python的基礎知識。數(shù)據(jù)處理篇(第5~9章):首先通過描述性統(tǒng)計分析進行數(shù)據(jù)探索,繼而講到基本的報表和統(tǒng)計制圖,還包括使用SAS EG進行數(shù)據(jù)處理,用Python進行數(shù)據(jù)整合、數(shù)據(jù)清洗,構建出滿足分析需求的數(shù)據(jù)集。統(tǒng)計分析篇(第10~14章):從統(tǒng)計學的基本概念引出假設檢驗與樣本t檢驗,三大統(tǒng)計檢驗、構造預測模型,并分享基于時間序列算法的建模方法。
(1)作者背景資深:4位作者都是在金融領域有10~20年數(shù)據(jù)挖掘和分析經(jīng)驗的資深專家,技術功底深厚,業(yè)務經(jīng)驗豐富。
(2)高維指導低維:作者在金融行業(yè)有10~20年項目實戰(zhàn)和項目咨詢經(jīng)驗,深知初學者的難點和痛點,量身打造,事半功倍。
(3)金融業(yè)務驅動:以真實的業(yè)務場景和案例為驅動,涵蓋金融數(shù)據(jù)分析的全流程,告別純理論和不接地氣。
(4)從入門到進階:幫助讀者零基礎掌握金融數(shù)據(jù)分析的工具、思路、方法和技巧,快速實現(xiàn)從入門到進階的突破。
為什么要寫這本書隨著現(xiàn)代信息技術的不斷發(fā)展,以大數(shù)據(jù)為基礎的各類金融科技應用成為市場熱點。近年來,隨著數(shù)據(jù)治理不斷被強化及數(shù)據(jù)資產(chǎn)的熱度不斷升溫,各金融機構已經(jīng)有了一定的數(shù)據(jù)基礎;跀(shù)據(jù)挖掘手段開展精準營銷、風險管控、運營優(yōu)化,已經(jīng)成為數(shù)據(jù)應用的必然趨勢。未來,隨著物聯(lián)網(wǎng)等技術的不斷推廣,數(shù)據(jù)量的增速將更為迅猛,大數(shù)據(jù)應用勢不可擋。在大數(shù)據(jù)轉型趨勢下,各企業(yè)也在思考如何不被市場淘汰,如何使數(shù)據(jù)的價值化。大數(shù)據(jù)應用一方面需要有數(shù)據(jù)可挖掘,另一方面需要數(shù)據(jù)分析專家。賦能金融企業(yè)內部人員,使之成為業(yè)務感知能力強、分析技術過硬的雙料人才,是培養(yǎng)數(shù)據(jù)分析專家快捷、實際的途徑。因此,市場上急需一本金融業(yè)務與數(shù)據(jù)分析技術相融合的參考書。基于對當前金融機構在數(shù)據(jù)分析中的痛點、通病的認識,以及在業(yè)界一流企業(yè)和咨詢公司的實踐,我們決心編寫一本適合金融行業(yè)數(shù)據(jù)分析人員入門的圖書。 讀者對象根據(jù)當前金融行業(yè)數(shù)字化轉型先進案例,我們知道客戶、產(chǎn)品、運營等前臺部門,以及數(shù)據(jù)管理、風險管理等中臺部門的從業(yè)人員均需要具備數(shù)據(jù)分析思維。也就是說,本書面向的讀者群包括:營銷、運營部門的數(shù)據(jù)分析師風控部門的從業(yè)人員大數(shù)據(jù)部門的工程師高校數(shù)學、統(tǒng)計學、金融工程、計算機科學及技術等專業(yè)的學生科技金融、金融大數(shù)據(jù)相關行業(yè)的同人本書特色雖然數(shù)據(jù)分析已經(jīng)不是新概念,但是市面上系統(tǒng)地講解金融行業(yè)數(shù)據(jù)分析師如何成長的書不多。本書在業(yè)務方面涵蓋用戶畫像、客戶價值預測、精準營銷預測等,在方法論方面涵蓋描述統(tǒng)計、假設推斷、預測性建模等。同時,本書貼合金融行業(yè)的分析軟件環(huán)境,將新興的Python與傳統(tǒng)的SAS相結合,以便于讀者快速掌握相關技術。另外,市面上Python的編程基礎和機器學習圖書眾多,但是鮮有從數(shù)據(jù)分析角度進行講解的,而且Python本身的數(shù)據(jù)分析軟件包也不完善。在本書中,筆者結合多年的數(shù)據(jù)分析咨詢經(jīng)驗,提供了常用的函數(shù),便于讀者在實際工作中快速上手。如何閱讀本書本書共14章,分為3篇。分析工具篇(第1~4章):介紹SAS EG的菜單操作和Python的入門知識。數(shù)據(jù)處理篇(第5~9章):從構建統(tǒng)計指標和數(shù)據(jù)可視化開始講解,將數(shù)據(jù)查詢、數(shù)據(jù)整合、數(shù)據(jù)清洗相結合,構建出滿足分析需求的數(shù)據(jù)集。統(tǒng)計分析篇(第10~14章):從假設檢驗開始,介紹如何從業(yè)務洞察中獲取靈感,然后用數(shù)據(jù)驗證靈感,并且根據(jù)得到的靈感構建統(tǒng)計模型,以便預測客戶的未來價值或者營銷響應的概率。其中,統(tǒng)計分析篇通過實例講解數(shù)據(jù)分析應用,相比于前兩篇更獨立。如果你是一名有編程經(jīng)驗的高手,可以直接閱讀這部分內容。如果你是一名初學者,請一定從第1章的基礎理論知識開始學習。勘誤和支持請關注微信公眾號數(shù)據(jù)資管,以下載書中的演示數(shù)據(jù)和腳本,觀看教學視頻,交流問題和反饋意見。也可以發(fā)送郵件至453288431@qq.com與作者聯(lián)系。期待得到你們的真摯反饋!致謝首先,感謝指導過我們工作和寫作的各位領導、老師,正是他們的鼓勵和鞭策才使得本書終面市。其次,感謝機械工業(yè)出版社華章公司的策劃編輯楊福川,他在這一年多時間中始終支持我們的寫作,鼓勵和幫助我們順利完稿。后,謹以此書獻給我們親愛的家人,以及眾多熱愛金融數(shù)據(jù)分析的朋友們!
張秋劍就職于騰訊云金融拓展中心,從事微信財富營銷管理、數(shù)據(jù)中臺、AI應用等解決方案拓展工作,研究方向包括數(shù)字化轉型、創(chuàng)新實踐等。
張浩曾任騰訊云金融首席架構師和星環(huán)科技金融行業(yè)技術總監(jiān),主要從事大數(shù)據(jù)、人工智能、云計算、區(qū)塊鏈、聯(lián)邦學習等相關技術研發(fā)與產(chǎn)品設計,具有豐富的企業(yè)架構設計、企業(yè)數(shù)字化戰(zhàn)略轉型運營與業(yè)務咨詢經(jīng)驗。
周大川就職于某中央金融企業(yè)金融科技研發(fā)中心,主要從事企業(yè)級數(shù)據(jù)平臺開發(fā)、核心業(yè)務平臺建設、AI賦能金融科技創(chuàng)新等工作,具有豐富的新一代金融業(yè)務系統(tǒng)建設經(jīng)驗。
常國珍曾任畢馬威咨詢大數(shù)據(jù)總監(jiān),具有近20年數(shù)據(jù)挖掘、精益數(shù)據(jù)治理、數(shù)字化運營咨詢經(jīng)驗,是金融信用風險、反欺詐和反洗錢算法領域的專家。
前言分析工具篇第1章 數(shù)據(jù)科學與數(shù)理統(tǒng)計21.1 數(shù)據(jù)科學的基本概念21.2 數(shù)理統(tǒng)計技術51.2.1 描述性統(tǒng)計分析51.2.2 統(tǒng)計推斷與統(tǒng)計建模6第2章 SAS EG數(shù)據(jù)操作基礎82.1 SAS EG入門82.1.1 SAS EG簡介82.1.2 SAS EG的窗口及菜單92.2 訪問數(shù)據(jù)102.2.1 SAS EG實現(xiàn)方式112.2.2 SAS程序實現(xiàn)方式132.3 定義SAS數(shù)據(jù)集132.3.1 SAS數(shù)據(jù)的相關概念132.3.2 SAS EG實現(xiàn)方式162.3.3 SAS程序實現(xiàn)方式182.4 導入其他格式的數(shù)據(jù)文件192.4.1 SAS EG實現(xiàn)方式192.4.2 SAS程序實現(xiàn)方式21第3章 Python編程基礎223.1 Python概述223.2 Anaconda的安裝及使用方法233.2.1 下載與安裝233.2.2 使用Jupyter Notebook243.2.3 使用Spyder253.2.4 使用Conda管理第三方庫273.3 Python的基本數(shù)據(jù)類型293.3.1 字符串293.3.2 浮點型和整型293.3.3 布爾類型303.3.4 其他數(shù)據(jù)類型313.4 Python的基本數(shù)據(jù)結構313.4.1 列表323.4.2 元組333.4.3 集合333.4.4 字典343.5 Python的編程結構353.5.1 三種基本的編程結構簡介353.5.2 順序結構353.5.3 分支結構363.5.4 循環(huán)結構373.6 Python的函數(shù)與模塊403.6.1 Python的函數(shù)403.6.2 Python的模塊423.7 使用Pandas讀寫結構化數(shù)據(jù)433.7.1 讀數(shù)據(jù)433.7.2 寫數(shù)據(jù)46第4章 在SAS EG中使用程序474.1 如何在SAS EG中使用程序474.2 SAS程序494.2.1 SAS程序分析簡介494.2.2 DATA步504.2.3 PROC步51數(shù)據(jù)處理篇第5章 描述性統(tǒng)計分析與制圖545.1 描述性統(tǒng)計分析545.1.1 變量度量類型與分布類型545.1.2 變量的統(tǒng)計量565.1.3 連續(xù)變量的分布與集中趨勢565.1.4 連續(xù)變量的離散程度585.1.5 數(shù)據(jù)分布的對稱與高矮595.2 制作報表與統(tǒng)計圖605.3 制圖步驟及統(tǒng)計圖適用場景645.4 利用SAS EG進行統(tǒng)計分析675.4.1 連續(xù)變量描述性統(tǒng)計分析675.4.2 單因子頻數(shù)統(tǒng)計分析695.4.3 匯總統(tǒng)計分析725.4.4 繪制條形圖進行統(tǒng)計分析765.4.5 繪制地圖進行統(tǒng)計分析79第6章 表數(shù)據(jù)的行處理826.1 數(shù)據(jù)篩選826.1.1 SAS EG實現(xiàn)方式826.1.2 SAS程序實現(xiàn)方式846.2 排序與求秩876.2.1 SAS EG實現(xiàn)方式876.2.2 SAS程序實現(xiàn)方式946.3 抽樣956.3.1 抽樣理論介紹956.3.2 SAS EG實現(xiàn)方式976.3.3 SAS程序實現(xiàn)方式996.4 數(shù)據(jù)分組和匯總1006.4.1 SAS EG實現(xiàn)方式1006.4.2 SAS程序實現(xiàn)方式102第7章 表數(shù)據(jù)的列處理1037.1 構造列變量1037.2 拆分列1057.3 堆疊列1077.4 轉置列1107.4.1 SAS EG實現(xiàn)方式1117.4.2 SAS 程序實現(xiàn)方式1137.5 對列重編碼1147.5.1 SAS EG實現(xiàn)方式1147.5.2 SAS程序實現(xiàn)方式1197.6 變量標準化1197.6.1 SAS EG實現(xiàn)方式1207.6.2 SAS程序實現(xiàn)方式122第8章 數(shù)據(jù)集的操作1248.1 縱向連接1248.1.1 SAS EG實現(xiàn)方式1258.1.2 SAS程序實現(xiàn)方式1278.2 橫向連接1318.2.1 SAS EG實現(xiàn)方式1318.2.2 SAS程序實現(xiàn)方式1358.3 數(shù)據(jù)集的比較1388.3.1 SAS EG實現(xiàn)方式1388.3.2 SAS程序實現(xiàn)方式1418.4 創(chuàng)建格式1428.4.1 相關理論介紹1428.4.2 SAS EG實現(xiàn)方式1438.4.3 SAS程序實現(xiàn)方式1468.5 刪除數(shù)據(jù)集、格式和視圖1478.5.1 SAS EG實現(xiàn)方式1478.5.2 SAS程序實現(xiàn)方式148第9章 利用Python處理數(shù)據(jù)1499.1 數(shù)據(jù)整合1509.1.1 行操作和列操作1509.1.2 條件查詢1529.1.3 橫向連接1559.1.4 縱向合并1579.1.5 排序1599.1.6 分組匯總1609.1.7 拆分與堆疊列1639.1.8 賦值與條件賦值1659.2 數(shù)據(jù)清洗1679.2.1 重復值處理1679.2.2 缺失值處理1689.2.3 噪聲值處理1709.3 實戰(zhàn)1759.3.1 提取行為特征的RFM方法1759.3.2 使用RFM方法計算變量1769.3.3 數(shù)據(jù)整理與匯報177統(tǒng)計分析篇第10章 數(shù)據(jù)科學的統(tǒng)計推斷18010.1 基本的統(tǒng)計學概念18010.1.1 總體、樣本和統(tǒng)計量18010.1.2 點估計、區(qū)間估計和中心極限定理18110.2 假設檢驗18610.2.1 理論介紹18610.2.2 利用Python實現(xiàn)單樣本t檢驗18910.2.3 利用SAS EG實現(xiàn)單樣本t檢驗18910.2.4 利用SAS EG實現(xiàn)雙樣本t檢驗18910.2.5 利用Python實現(xiàn)雙樣本t檢驗19110.3 方差分析19310.3.1 利用Python實現(xiàn)單因素方差分析19310.3.2 利用SAS EG實現(xiàn)單因素方差分析19810.3.3 利用Python實現(xiàn)多因素方差分析20210.3.4