目前,大數(shù)據(jù)已上升為國家戰(zhàn)略,從輔助變?yōu)橐I,從熱點變?yōu)橹c。因此,在各類以應用型人才培養(yǎng)為主的高校中,需要面向文、管、理、工等不同學科的學生普及大數(shù)據(jù)理念及其相關技術,以利于其在專業(yè)領域的實踐中應用大數(shù)據(jù)理念,實施大數(shù)據(jù)技術。本書從大數(shù)據(jù)概念及特點入手,以大數(shù)據(jù)應用的技術框架為主線,首先介紹了大數(shù)據(jù)采集與準備、大數(shù)據(jù)
本書主要介紹了Spark運行原理及性能調優(yōu)的相關實踐,從Spark框架內部及外部運行環(huán)境等不同角度分析Spark性能調優(yōu)的過程。第1章介紹了Linux系統(tǒng)中各種監(jiān)控工具的使用,對CPU、內存、網絡、I/O等方面進行介紹,并提供了集群監(jiān)控報警的解決方案。第2章介紹了Java虛擬機(JVM)的基本知識、垃圾回收機制,以及對
本書主要介紹數(shù)據(jù)挖掘和數(shù)據(jù)分析的基本概念和方法,包括數(shù)據(jù)的基本屬性和概念、數(shù)據(jù)預處理技術、數(shù)據(jù)立方體和OLAP技術、頻繁模式挖掘、回歸分析、分類、聚類、離群點分析。每一部分先介紹基本概念、理論基礎、應用實例、思考習題。書中涉及的模型和算法均給予了相應的實例,便于讀者更好的理解和使用模型。
本書是作者在多年科學研究的基礎上整理完善而成的,是自然語言處理技術在文本分類領域應用的綜述和總結,本書專業(yè)性較強,注重對技術理論依據(jù)和解決思路的精細講解,讀者可通過對本書的學習了解和掌握人工智能相關技術在網絡文本處理時的實現(xiàn)方法和操作流程。本書的內容包括:文本預處理、特征表示與降維、文本分類算法、多標簽文本分類技術、短
全書共有12章,從Hadoop概述開始,介紹了Hadoop的安裝與配置管理,并對Hadoop的生態(tài)體系架構進行了介紹,包括HDFS技術、YARN技術、MapReduce技術、HadoopI/O操作、海量數(shù)據(jù)庫技術HBase、ZooKeeper技術、分布式數(shù)據(jù)倉庫技術Hive、分布式數(shù)據(jù)分析工具Pig,以及數(shù)據(jù)遷移工具S
本書介紹了大數(shù)據(jù)的概念、特點、市場、技術、分析、應用,還專門討論了云計算、人工智能和區(qū)塊鏈等熱點新技術及應用,教學設計層次清晰,每個單元都遵循同樣的編排體系,內容圖文并茂,對口語技能、閱讀技能、翻譯技能的學習任務進行了合理的設計。而且,本書還對每個單元的教學重點和專業(yè)詞匯進行了注釋,設置了基于內容的閱讀理解練習、詞匯練
本書將古典、非線性和現(xiàn)代控制理論結合起來,借助MATLAB庫函數(shù)、仿真工具、硬件平臺對象完成控制理論的分析和設計實驗。通過實時觀察實物的動作,增強學生的興趣和感知能力,幫助學生更好理解自動控制理論,并增強學生的研究能力和創(chuàng)新能力。學術價值體現(xiàn)在: (1)利用硬件實驗平臺,學生可以理解控制器參數(shù)的作用,掌握調整直流伺服
本書的主要章節(jié)包括分位數(shù)回歸、等分線性回歸、數(shù)據(jù)包絡分析法、隨機前沿分析法、層次分析法、灰關聯(lián)分析、模糊理論、粗糙集理論、小波時間序列、組合優(yōu)化問題等。此外,本書引入了最新的R數(shù)據(jù)挖掘方法;摒除掉艱深難懂的理論,以最淺顯的方式介紹數(shù)據(jù)挖掘理論,讓讀者迅速掌握,輕松入門;力求最簡單的R程序或安裝包運行數(shù)據(jù)挖掘案例分析,詳
圖分析可以揭示復雜系統(tǒng)和大規(guī)模網絡的運作機制,圖算法為構建智能應用程序提供了快速建模的框架,有助于更準確、更快速地做出預測。包括商品推薦和欺詐檢測在內的許多人工智能問題能轉換為圖論問題。本書基于Spark和Neo4j講解近20種常用的圖算法,幫助讀者拓展重要圖分析類型的相關知識和能力,更快速地發(fā)現(xiàn)數(shù)據(jù)中的模式并找到更優(yōu)
本書以培養(yǎng)職業(yè)崗位能力為目標,融知識、理論、實踐為一體,體現(xiàn)“理實一體化”教學思想,涵蓋省級“十二五”規(guī)劃課題的研究成果。