本書包含十六章,分為四個部分:概念篇主要介紹大數(shù)據(jù)管理與應(yīng)用的基本概念、分析的基本思路;基礎(chǔ)篇主要介紹大數(shù)據(jù)管理與應(yīng)用的數(shù)學(xué)基礎(chǔ)和機(jī)器學(xué)習(xí)基礎(chǔ);技術(shù)篇主要介紹大數(shù)據(jù)管理與應(yīng)用的數(shù)據(jù)采集與存儲技術(shù)、數(shù)據(jù)預(yù)處理技術(shù)、數(shù)據(jù)回歸分析技術(shù)、數(shù)據(jù)分類分析技術(shù)、數(shù)據(jù)聚類分析技術(shù)、數(shù)據(jù)關(guān)聯(lián)分析技術(shù)、深度學(xué)習(xí)技術(shù)、文本分析技術(shù)、Web分
本書首先介紹了R語言的相關(guān)知識,包括R語言基礎(chǔ)、R語言可視化技術(shù)。隨后本書詳細(xì)介紹了數(shù)據(jù)挖掘與數(shù)據(jù)分析中重要的理論方法與基礎(chǔ)知識,包括線性回歸、邏輯回歸、決策樹與回歸樹、隨機(jī)森林、貝葉斯分類器等內(nèi)容,并展示了如何將R語言用到這些方法的具體場景中。本書通過結(jié)合數(shù)據(jù)挖掘技術(shù)的理論知識與R語言的實(shí)戰(zhàn)應(yīng)用,幫助讀者更好地運(yùn)用R
本書詳細(xì)介紹了工業(yè)控制系統(tǒng)的安全知識及相關(guān)實(shí)踐操作。全書共有9章,包括工業(yè)控制系統(tǒng)安全、工業(yè)控制設(shè)備安全、常見工業(yè)控制協(xié)議及安全性分析、工業(yè)控制系統(tǒng)的資產(chǎn)探測、漏洞檢測、入侵檢測與防護(hù)、異常檢測、安全風(fēng)險評估、入侵響應(yīng)等技術(shù)相關(guān)知識。本書結(jié)合編者團(tuán)隊(duì)自主研發(fā)的工控攻防靶場平臺以及對應(yīng)的實(shí)訓(xùn)系統(tǒng),提供了大量實(shí)驗(yàn),旨在幫助
本書較系統(tǒng)地介紹了計(jì)算機(jī)控制系統(tǒng)的分析、設(shè)計(jì)和綜合方法,主要作者長期從事自動控制原理、計(jì)算機(jī)控制以及現(xiàn)代控制工程等課程的教學(xué),在控制工程領(lǐng)域積累了三十多年的科研工作經(jīng)驗(yàn)。全書共分11章,內(nèi)容包括計(jì)算機(jī)控制系統(tǒng)的信號處理與數(shù)學(xué)描述方法、計(jì)算機(jī)控制系統(tǒng)分析與設(shè)計(jì)方法、控制網(wǎng)絡(luò)與網(wǎng)絡(luò)化控制系統(tǒng)設(shè)計(jì)基礎(chǔ),以及計(jì)算機(jī)控制系統(tǒng)的綜
數(shù)字化轉(zhuǎn)型對社會和各類組織機(jī)構(gòu)提出了大數(shù)據(jù)管理的需求,數(shù)據(jù)資源管理能力將成為新時代各行各業(yè)信息管理者的核心競爭力。本書從數(shù)字化轉(zhuǎn)型與大數(shù)據(jù)管理的基本理論與應(yīng)用實(shí)際出發(fā),系統(tǒng)構(gòu)建數(shù)據(jù)資源管理的知識體系,內(nèi)容包括數(shù)據(jù)資源管理基本概念與原理、數(shù)據(jù)存儲與管理、數(shù)據(jù)架構(gòu)與設(shè)計(jì)、數(shù)據(jù)組織、元數(shù)據(jù)管理、數(shù)據(jù)分析與服務(wù)、數(shù)據(jù)質(zhì)量管理、
本書通過10個第一現(xiàn)場的案例故事,揭秘平臺流量機(jī)制的構(gòu)建角度與構(gòu)建過程,針對性地解決互聯(lián)網(wǎng)數(shù)據(jù)從業(yè)者面臨的棘手問題,包含觸達(dá)用戶、提升產(chǎn)品體驗(yàn)、優(yōu)化內(nèi)容生態(tài)等重要運(yùn)營命題的思維方式和應(yīng)用方法。 全書分為3個部分,共17章。第1部分(第1~7章)為工具篇,詳細(xì)介紹互聯(lián)網(wǎng)數(shù)據(jù)分析師所應(yīng)具備的基礎(chǔ)思維方式和方法論,互聯(lián)網(wǎng)產(chǎn)品
本書以大數(shù)據(jù)分析應(yīng)用崗位職業(yè)能力遞進(jìn)為主線,較為全面地介紹了Spark大數(shù)據(jù)技術(shù)的相關(guān)知識。全書共7章,內(nèi)容包括Spark生態(tài)圈中的SparkCore、SparkSQL、SparkStreaming、GraphX、MLlib等組件,以及海量離線數(shù)據(jù)的處理、基于歷史數(shù)據(jù)的交互式查詢、基于實(shí)時數(shù)據(jù)流的大數(shù)據(jù)處理、圖計(jì)算、機(jī)
數(shù)據(jù)科學(xué)的關(guān)鍵技術(shù)包括數(shù)據(jù)存儲計(jì)算、數(shù)據(jù)治理、結(jié)構(gòu)化數(shù)據(jù)分析、語音分析、視覺分析、文本分析和知識圖譜等方面。本書的重點(diǎn)是詳細(xì)介紹文本分析和知識圖譜方面的技術(shù)。文本分析技術(shù)主要包括文本預(yù)訓(xùn)練模型、多語種文本分析、文本情感分析、文本機(jī)器翻譯、文本智能糾錯、NL2SQL問答以及ChatGPT大語言模型等。知識圖譜技術(shù)主要包括
本書作為《大數(shù)據(jù)導(dǎo)論》(ISBN9787302500704)的配套實(shí)訓(xùn)教材,旨在幫助讀者夯實(shí)基礎(chǔ)知識,還原企業(yè)真實(shí)業(yè)務(wù),提升實(shí)操能力。本書從大數(shù)據(jù)開發(fā)所需要的基礎(chǔ)編程知識出發(fā),首先闡述Linux開發(fā)環(huán)境中常用的命令。接著介紹數(shù)據(jù)清洗工具Kettle的基礎(chǔ)操作以及常見的數(shù)據(jù)可視化效果,如餅圖、柱狀圖、折線圖、平行坐標(biāo)圖等
本書系統(tǒng)介紹了Hadoop生態(tài)系統(tǒng)主要組件的基本概念、特點(diǎn)、主要組成、運(yùn)行機(jī)制及存在的問題等內(nèi)容。全書共11章,內(nèi)容包含大數(shù)據(jù)基本概念、大數(shù)據(jù)處理平臺Hadoop、分布式文件系統(tǒng)HDFS、HDFS2.0新特性、分布式計(jì)算框架MapReduce、數(shù)據(jù)倉庫Hive、分布式數(shù)據(jù)庫HBase、數(shù)據(jù)遷移工具Sqoop、日志采集系