《數(shù)據(jù)挖掘方法與應(yīng)用》以應(yīng)用為導(dǎo)向介紹數(shù)據(jù)挖掘的相關(guān)工具、理論和方法,包括數(shù)據(jù)挖掘概述、數(shù)據(jù)挖掘工具、數(shù)據(jù)與數(shù)據(jù)平臺、數(shù)據(jù)預(yù)處理、關(guān)聯(lián)分析、決策樹、貝葉斯分類和神經(jīng)網(wǎng)絡(luò)。通過循序漸進地講解數(shù)據(jù)挖掘可使用的工具、數(shù)據(jù)存儲及分析環(huán)境、原始數(shù)據(jù)可能存在的問題及相應(yīng)的預(yù)處理方法、數(shù)據(jù)挖掘經(jīng)典算法等相關(guān)知識,使讀者對數(shù)據(jù)挖掘有整
Zabbix憑借其既豐富又優(yōu)秀的特性,在國內(nèi)外的監(jiān)控市場蓬勃發(fā)展,投靠Zabbix陣營的用戶不計其數(shù)。面對Zabbix的蔓延,與其逡巡觀望,不如盡早加入搶占先機!本書詳細介紹Zabbix各項功能,包括安裝、配置、告警、可視化、分布式監(jiān)控、自動化等。 本書分為14章,由淺入深地對Zabbix的基礎(chǔ)和高級功能進行細致地講
《Flink內(nèi)核原理與實現(xiàn)》既講解了Flink的入門、安裝、流計算開發(fā)入門、類型和序列化系統(tǒng)、監(jiān)控運維、安全管理配置等基礎(chǔ)知識,又講解了Flink的時間概念、Window的實現(xiàn)原理及其代碼解析,F(xiàn)link的容錯機制原理,F(xiàn)link容錯的關(guān)鍵設(shè)計、代碼實現(xiàn)分析,F(xiàn)linkJob從源碼到執(zhí)行整個過程的解析,F(xiàn)linkJob
內(nèi)容簡介這是一部全面講解數(shù)據(jù)產(chǎn)品經(jīng)理核心知識體系的著作。12位作者大多來自國內(nèi)的知名企業(yè),涉及不同的行業(yè),讓本書擁有了更廣泛的視角,能幫助讀者從不同的角度去了解數(shù)據(jù)產(chǎn)品經(jīng)理如何在數(shù)據(jù)、產(chǎn)品、運營、市場等多個方面產(chǎn)生價值。本書的*終目的是讓讀者全面了解數(shù)據(jù)產(chǎn)品經(jīng)理的工作內(nèi)容、系統(tǒng)掌握數(shù)據(jù)產(chǎn)品的核心知識體系,快速實現(xiàn)從入門
本書詳細闡述了培養(yǎng)復(fù)合型大數(shù)據(jù)專業(yè)人才所需要的大數(shù)據(jù)相關(guān)知識。全書共9章,內(nèi)容包括大數(shù)據(jù)概述、大數(shù)據(jù)與其他新興技術(shù)的關(guān)系、大數(shù)據(jù)基礎(chǔ)知識、大數(shù)據(jù)應(yīng)用、數(shù)據(jù)采集與預(yù)處理、數(shù)據(jù)存儲與管理、數(shù)據(jù)處理與分析、數(shù)據(jù)可視化、大數(shù)據(jù)分析綜合案例。在大數(shù)據(jù)基礎(chǔ)知識部分,本書詳細介紹了與培養(yǎng)學(xué)生的數(shù)據(jù)素養(yǎng)相關(guān)的知識,包括大數(shù)據(jù)安全、大數(shù)
本書是高校的大數(shù)據(jù)導(dǎo)論課程教材,清楚地介紹了大數(shù)據(jù)相關(guān)的概念、理論、術(shù)語與基礎(chǔ)技術(shù),并使用真實連貫的商業(yè)案例以及簡單的圖表,幫助讀者更清晰地理解大數(shù)據(jù)技術(shù)。本書可作為高等院校相關(guān)專業(yè)“大數(shù)據(jù)基礎(chǔ)”“大數(shù)據(jù)導(dǎo)論”等課程的教材,也可供有一定實踐經(jīng)驗的軟件開發(fā)人員、管理人員和所有對大數(shù)據(jù)感興趣的人士閱讀。
共分11章,第1章對大數(shù)據(jù)及Hadoop進行總體介紹,第2章講解了如何搭建Hadoop集群。第3-5章講解了HDFS分布式文件系統(tǒng)、MapReduce分布式計算框架以及Zookeeper分布式協(xié)調(diào)服務(wù)。第6章講解Hadoop2.0的新特性。第7-10章主要講解了Hadoop生態(tài)圈中的相關(guān)輔助系統(tǒng),包括Hive、HBas
本書系統(tǒng)介紹了大數(shù)據(jù)基礎(chǔ)知識和相關(guān)技術(shù),全書分為大數(shù)據(jù)概述篇、大數(shù)據(jù)存儲與管理篇、大數(shù)據(jù)采集與預(yù)處理篇、大數(shù)據(jù)分析與挖掘篇、大數(shù)據(jù)平臺Hadoop實踐與案例分析篇。全書共15章,主要內(nèi)容包括大數(shù)據(jù)基本概念、大數(shù)據(jù)存儲與管理概念及技術(shù)、大數(shù)據(jù)采集及預(yù)處理技術(shù)、大數(shù)據(jù)計算模式、大數(shù)據(jù)分布式并行處理框架Hadoop、大數(shù)據(jù)分
本書作為Spark的入門書,從Spark核心編程語言Scala講起,涵蓋當(dāng)前Spark主流的開發(fā)組件。以實操為主,深入講解每一個操作步驟,包括SparkRDD離線數(shù)據(jù)處理、SparkSQL快速結(jié)構(gòu)化數(shù)據(jù)處理、SparkStreaming實時數(shù)據(jù)處理,同時包括案例講解、源碼剖析、常用Shell命令和JavaAPI詳解。即
本書系統(tǒng)地講解了大數(shù)據(jù)處理常用技術(shù),具體包括大數(shù)據(jù)處理架構(gòu)Hadoop、分布式文件系統(tǒng)HDFS、MapReduce編程模型、分布式數(shù)據(jù)庫Hbase、NoSQL數(shù)據(jù)庫、Spark分布式內(nèi)存計算、MapReduce應(yīng)用開發(fā)、SparkSQL編程、數(shù)據(jù)可視化。本書編寫特色理論與具體操作相結(jié)合,較低基礎(chǔ)入門大數(shù)據(jù)技術(shù)。讀者對象