高等學(xué)校計(jì)算機(jī)規(guī)劃教材:數(shù)據(jù)挖掘原理與實(shí)踐
定 價(jià):35 元
- 作者:蔣盛益 ,李霞 ,鄭琪 著
- 出版時(shí)間:2011/8/1
- ISBN:9787121140501
- 出 版 社:電子工業(yè)出版社
- 中圖法分類(lèi):TP274
- 頁(yè)碼:284
- 紙張:膠版紙
- 版次:1
- 開(kāi)本:16開(kāi)
《高等學(xué)校計(jì)算機(jī)規(guī)劃教材:數(shù)據(jù)挖掘原理與實(shí)踐》分為數(shù)據(jù)挖掘理論和數(shù)據(jù)挖掘?qū)嵺`兩大部分;A(chǔ)理論部分的主要內(nèi)容包括數(shù)據(jù)挖掘的基本概念、數(shù)據(jù)挖掘的預(yù)處理、聚類(lèi)分析、分類(lèi)與回歸、關(guān)聯(lián)規(guī)則挖掘、例外點(diǎn)檢測(cè)。數(shù)據(jù)挖掘?qū)嵺`部分討論了數(shù)據(jù)挖掘在通信行業(yè)、文本挖掘等方面的實(shí)際應(yīng)用;通過(guò)四個(gè)案例展示了在通信行業(yè)中如何利用數(shù)據(jù)挖掘進(jìn)行客戶細(xì)分、客戶流失分析、客戶社會(huì)關(guān)系挖掘、業(yè)務(wù)交叉銷(xiāo)售;通過(guò)跨語(yǔ)言智能學(xué)術(shù)搜索系統(tǒng)和基于內(nèi)容的垃圾郵件識(shí)別兩個(gè)案例展示了數(shù)據(jù)挖掘在文本挖掘方面的應(yīng)用。
《高等學(xué)校計(jì)算機(jī)規(guī)劃教材:數(shù)據(jù)挖掘原理與實(shí)踐》可作為高等院校計(jì)算機(jī)電子商務(wù)及相關(guān)專業(yè)的學(xué)生相關(guān)的教材或參考書(shū),也可供從事數(shù)據(jù)挖掘研究、設(shè)計(jì)等工作的科研、技術(shù)人員參考。
數(shù)據(jù)挖掘技術(shù)應(yīng)用越來(lái)越廣泛,社會(huì)對(duì)掌握數(shù)據(jù)挖掘技術(shù)的人才需求越來(lái)越大,越來(lái)越多的高校在計(jì)算機(jī)相關(guān)專業(yè)及經(jīng)濟(jì)、管理類(lèi)專業(yè)開(kāi)設(shè)了數(shù)據(jù)挖掘課程,以適應(yīng)社會(huì)的需求。
本書(shū)旨在向讀者介紹數(shù)據(jù)挖掘的基本原理、方法,數(shù)據(jù)挖掘應(yīng)用流程,通過(guò)原理、方法應(yīng)用的背景介紹,使讀者理解、掌握如何選擇數(shù)據(jù)挖掘方法解決實(shí)際問(wèn)題,通過(guò)案例的分析使讀者能夠應(yīng)用這些方法解決現(xiàn)實(shí)世界中的問(wèn)題。
全書(shū)分為上、下兩篇,共分8章。上篇包括第1~6章,下篇包括第7~8章。
第1章介紹數(shù)據(jù)挖掘的基本概念以及數(shù)據(jù)挖掘的重要應(yīng)用領(lǐng)域。
第2章介紹數(shù)據(jù)的基本統(tǒng)計(jì)量以及數(shù)據(jù)預(yù)處理的常用方法。
第3章介紹分類(lèi)的基本概念、應(yīng)用背景,重點(diǎn)介紹決策樹(shù)、貝葉斯、最近鄰分類(lèi)方法。
第4章介紹聚類(lèi)分析的基本概念、應(yīng)用背景,重點(diǎn)介紹常用的聚類(lèi)方法。
第5章介紹關(guān)聯(lián)分析的基本概念、應(yīng)用背景,重點(diǎn)介紹頻繁模式挖掘算法(Apriori算法和Fp-growth算法)、序列模式挖掘算法。
第6章介紹例外點(diǎn)挖掘的基本概念、應(yīng)用背景,重點(diǎn)介紹基于距離、基于相對(duì)密度、基于聚類(lèi)的例外點(diǎn)挖掘方法。
第7章介紹數(shù)據(jù)挖掘在通信行業(yè)中的客戶細(xì)分、客戶流失分析、客戶社會(huì)關(guān)系挖掘、業(yè)務(wù)交叉銷(xiāo)售等方面的應(yīng)用,并通過(guò)實(shí)際案例進(jìn)行了分析。
第8章介紹數(shù)據(jù)挖掘在文本處理方面的應(yīng)用,介紹文本挖掘和Web挖掘的基本概念,通過(guò)跨語(yǔ)言智能學(xué)術(shù)搜索系統(tǒng)和基于內(nèi)容的垃圾郵件識(shí)別兩個(gè)案例進(jìn)行了分析。
本書(shū)除了介紹數(shù)據(jù)挖掘的經(jīng)典方法之外,也融入了作者的部分研究成果。
本書(shū)的出版融會(huì)了許多人的辛勤勞動(dòng)。第1、2、4、6、7、8章由蔣盛益負(fù)責(zé),第3章由李霞負(fù)責(zé),第5章由鄭琪負(fù)責(zé)。參與編寫(xiě)工作的還有龐觀松、王連喜、吳美玲、謝照青、陽(yáng)垚、苗邦等。印鑒教授、王家兵副教授認(rèn)真審閱了初稿,指出了一些紕漏,并提出了修改建議。本書(shū)的出版得到了電子工業(yè)出版社的大力支持,書(shū)中參考了許多學(xué)者的研究成果,在此一并表示衷心感謝。
限于作者學(xué)識(shí)水平,書(shū)中肯定存在不足和疏漏,敬請(qǐng)讀者批評(píng)指正。
本書(shū)為任課教師提供配套的教學(xué)資源(包含電子教案和例題源代碼),需要者可登錄華信教育資源網(wǎng),注冊(cè)之后進(jìn)行下載。
作者
上篇 理論篇
第1章 緒論
1.1 數(shù)據(jù)挖掘產(chǎn)生的背景
1.2 數(shù)據(jù)挖掘任務(wù)及過(guò)程
1.2.1 數(shù)據(jù)挖掘定義
1.2.2 數(shù)據(jù)挖掘?qū)ο?br>1.2.3 數(shù)據(jù)挖掘任務(wù)
1.2.4 數(shù)據(jù)挖掘過(guò)程
1.2.5 數(shù)據(jù)挖掘常用軟件簡(jiǎn)介
1.3 數(shù)據(jù)挖掘應(yīng)用
1.3.1 數(shù)據(jù)挖掘在商業(yè)領(lǐng)域中的應(yīng)用
1.3.2 數(shù)據(jù)挖掘在計(jì)算機(jī)領(lǐng)域中的應(yīng)用
1.3.3 其他領(lǐng)域中的應(yīng)用
1.4 數(shù)據(jù)挖掘技術(shù)的前景、研究熱點(diǎn)
1.4.1 數(shù)據(jù)挖掘技術(shù)的價(jià)值和前景
1.4.2 數(shù)據(jù)挖掘的研究熱點(diǎn)
1.4.3 數(shù)據(jù)挖掘的未來(lái)發(fā)展
本章小結(jié)
習(xí)題1
第2章 數(shù)據(jù)處理基礎(chǔ)
2.1 數(shù)據(jù)
2.1.1 數(shù)據(jù)及數(shù)據(jù)類(lèi)型
2.1.2 數(shù)據(jù)集的類(lèi)型
2.2 數(shù)據(jù)統(tǒng)計(jì)特性
2.2.1 數(shù)據(jù)的中心度量
2.2.2 數(shù)據(jù)散布程度度量
2.3 數(shù)據(jù)預(yù)處理
2.3.1 數(shù)據(jù)清理
2.3.2 數(shù)據(jù)聚合
2.3.3 數(shù)據(jù)變換
2.3.4 數(shù)據(jù)歸約
2.4 相似性度量
2.4.1 屬性之間的相似性度量
2.4.2 對(duì)象之間的相似性度量
2.5 本章小結(jié)
習(xí)題2
第3章 分類(lèi)與回歸
3.1 概述
3.2 決策樹(shù)分類(lèi)方法
3.2.1 決策樹(shù)的基本概念
3.2.2 決策樹(shù)的構(gòu)建
3.2.3 ID3分類(lèi)算法
3.2.4 C4.5分類(lèi)算法
3.2.5 CART算法
3.3 貝葉斯分類(lèi)方法
3.3.1 貝葉斯定理
3.3.2 樸素貝葉斯分類(lèi)算法
3.4 K-最近鄰分類(lèi)方法
3.4.1 K-最近鄰分類(lèi)算法基本概念
3.4.2 K-最近鄰分類(lèi)算法描述
3.4.3 k-最近鄰分類(lèi)算法的優(yōu)缺點(diǎn)
3.5 神經(jīng)網(wǎng)絡(luò)分類(lèi)方法
3.5.1 人工神經(jīng)網(wǎng)絡(luò)的基本概念
3.5.2 典型神經(jīng)網(wǎng)絡(luò)模型介紹
3.5.3 神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點(diǎn)
3.6 支持向量機(jī)
3.7 集成學(xué)習(xí)法
3.8 不平衡類(lèi)問(wèn)題
3.9 分類(lèi)模型的評(píng)價(jià)
3.9.1 分類(lèi)模型性能評(píng)價(jià)指標(biāo)
3.9.2 分類(lèi)模型的過(guò)分?jǐn)M合
3.9.3 評(píng)估分類(lèi)模型性能的方法
3.10 回歸
3.10.1 線性回歸
3.10.2 非線性回歸
3.10.3 邏輯回歸
3.11 本章小結(jié)
習(xí)題3
第4章 聚類(lèi)分析
4.1 概述
4.1.1 聚類(lèi)分析研究的主要內(nèi)容
4.1.2 數(shù)據(jù)挖掘?qū)垲?lèi)算法的要求
4.1.3 典型聚類(lèi)方法簡(jiǎn)介
4.2 基于劃分的聚類(lèi)算法
4.2.1 基本k-means聚類(lèi)算法
4.2.2 二分k-means算法
4.2.3 k-means聚類(lèi)算法的拓展
4.2.4 k-medoids算法
4.3 層次聚類(lèi)算法
4.3.1 BIRCH算法
4.3.2 CURE算法
4.3.3 ROCK算法
4.4 基于密度的聚類(lèi)算法
4.5 基于圖的聚類(lèi)算法
4.5.1 Chameleon聚類(lèi)算法
4.5.2 基于SNN的聚類(lèi)算法
4.6 一趟聚類(lèi)算法
4.6.1 算法描述
4.6.2 聚類(lèi)閾值的選擇策略
4.7 基于模型的聚類(lèi)算法
4.7.1 期望最大化方法EM
4.7.2 概念聚類(lèi)
4.7.3 SOM方法
4.8 聚類(lèi)算法評(píng)價(jià)
本章小結(jié)
習(xí)題4
第5章 關(guān)聯(lián)分析
5.1 概述
5.2 頻繁項(xiàng)集發(fā)現(xiàn)算法
5.2.1 Apriori 算法
5.2.2 Fp-growth算法
5.3 關(guān)聯(lián)規(guī)則的生成
5.4 非二元屬性的關(guān)聯(lián)規(guī)則挖掘
5.5 關(guān)聯(lián)規(guī)則的評(píng)價(jià)
5.5.1 支持度和置信度
5.5.2 相關(guān)性分析
5.5.3 辛普森悖論
5.6 序列模式
5.6.1 問(wèn)題描述
5.6.2 序列模式發(fā)現(xiàn)算法
5.7 本章小結(jié)
習(xí)題
第6章 離群點(diǎn)挖掘
6.1 概述
6.2 基于統(tǒng)計(jì)的方法
6.3 基于距離的方法
6.4 基于相對(duì)密度的方法
6.5 基于聚類(lèi)的方法
6.5.1 基于對(duì)象離群因子的方法
6.5.2 基于簇的離群因子方法
6.5.3 基于聚類(lèi)的動(dòng)態(tài)數(shù)據(jù)離群點(diǎn)檢測(cè)
6.6 離群點(diǎn)挖掘方法的評(píng)估
6.7 本章小結(jié)
習(xí)題
下篇 實(shí)踐篇
第7章 數(shù)據(jù)挖掘在電信業(yè)中的應(yīng)用
7.1 數(shù)據(jù)挖掘在電信業(yè)的應(yīng)用概述
7.1.1 客戶細(xì)分
7.1.2 客戶流失預(yù)測(cè)分析
7.1.3 客戶社會(huì)關(guān)系挖掘
7.1.4 業(yè)務(wù)交叉銷(xiāo)售
7.1.5 欺詐客戶識(shí)別
7.2 案例一: 客戶通話模式分析
7.2.1 概述
7.2.2 數(shù)據(jù)描述
7.2.3 數(shù)據(jù)預(yù)處理
7.2.4 發(fā)現(xiàn)之旅
7.3 案例二:基于通話數(shù)據(jù)的社會(huì)網(wǎng)絡(luò)分析
7.3.1 概述
7.3.2 客戶呼叫圖的構(gòu)建
7.3.3 客戶呼叫圖的一般屬性及其應(yīng)用
7.3.4 客戶呼叫圖的社區(qū)發(fā)現(xiàn)及應(yīng)用
7.4 案例三:客戶細(xì)分與流失分析
7.4.1 概述
7.4.2 數(shù)據(jù)準(zhǔn)備
7.4.3 數(shù)據(jù)預(yù)處理
7.4.4 客戶聚類(lèi)分析
7.4.5 建立分類(lèi)預(yù)測(cè)模型
7.4.6 模型評(píng)估與調(diào)整優(yōu)化
7.5 案例四:移動(dòng)業(yè)務(wù)關(guān)聯(lián)分析
7.5.1 概述
7.5.2 數(shù)據(jù)準(zhǔn)備
7.5.3 數(shù)據(jù)預(yù)處理
7.5.4 關(guān)聯(lián)規(guī)則挖掘過(guò)程
7.5.5 規(guī)則的優(yōu)化
7.5.5 模型的應(yīng)用
7.6 本章小結(jié)
第8章 文本挖掘與Web數(shù)據(jù)挖掘
8.1 文本挖掘
8.1.1 分詞
8.1.2 文本表示與詞權(quán)重計(jì)算
8.1.3 文本特征選擇
8.1.4 文本分類(lèi)
8.1.5 文本聚類(lèi)
8.1.6 文檔自動(dòng)摘要
8.2 Web數(shù)據(jù)挖掘
8.2.1 Web內(nèi)容挖掘
8.2.2 Web使用挖掘
8.2.3 Web結(jié)構(gòu)挖掘
8.3 案例五——跨語(yǔ)言智能學(xué)術(shù)搜索系統(tǒng)
8.3.1 混合語(yǔ)種文本分詞
8.3.2 基于機(jī)器翻譯的跨語(yǔ)言信息檢索
8.3.3 不同語(yǔ)種文本的搜索結(jié)果聚類(lèi)
8.3.4 基于聚類(lèi)的個(gè)性化信息檢索
8.3.5 基于聚類(lèi)的查詢擴(kuò)展
8.3.6 其他檢索便利工具
8.3.7 系統(tǒng)性能評(píng)估
8.4 案例六——基于內(nèi)容的垃圾郵件識(shí)別
8.4.1 垃圾郵件識(shí)別方法簡(jiǎn)介
8.4.2 基于內(nèi)容的垃圾郵件識(shí)別方法工作原理
8.4.3 一種基于聚類(lèi)的垃圾郵件識(shí)別方法
8.5 本章小結(jié)
參考文獻(xiàn)