數(shù)據(jù)科學(xué)的理論基礎(chǔ)是數(shù)學(xué)。本書共六章。前三章系統(tǒng)介紹了數(shù)據(jù)科學(xué)里廣泛使用的線性代數(shù)、概率論、微積分以及最優(yōu)化理論的相關(guān)基礎(chǔ)知識;后三章簡練闡述了網(wǎng)絡(luò)分析、量子算法、大模型的基本數(shù)學(xué)原理和一些代表性算法。書中部分應(yīng)用案例源自作者的原創(chuàng)性工作,通過發(fā)現(xiàn)問題、分析問題、解決問題的邏輯鏈條,生動展示了數(shù)據(jù)建模在解決實際問題中的
數(shù)據(jù)是最有價值的資源,發(fā)掘這一價值需要超越技術(shù)本身。本書拋開數(shù)據(jù)科學(xué)技術(shù)的細節(jié),致力于解決該主題研究中通常沒有涵蓋的數(shù)據(jù)科學(xué)“其余部分”的關(guān)鍵問題。包括確立正確問題,收集正確數(shù)據(jù),進行正確分析,做出正確決策以及決策評估,與決策者建立信任,將數(shù)據(jù)科學(xué)團隊置于正確的組織節(jié)點,以及幫助公司實現(xiàn)數(shù)據(jù)驅(qū)動等內(nèi)容。這本書給出了數(shù)據(jù)
"《大數(shù)據(jù)平臺搭建與維護》以大數(shù)據(jù)平臺項目場景和工作任務(wù)驅(qū)動的方式搭建邏輯架構(gòu),以大數(shù)據(jù)平臺搭建與維護具體任務(wù)活動及工作步驟為核心構(gòu)建內(nèi)容體系,全書以工作手冊的形式進行編寫!洞髷(shù)據(jù)平臺搭建與維護》共包括6個項目,介紹了Linux系統(tǒng)的安裝與配置、HadoopHDFS高可用集群搭建、HadoopYARN高可用集群搭建與
"本書以Hadoop及其周邊框架為主線,介紹了整個Hadoop生態(tài)系統(tǒng)主流的大數(shù)據(jù)組件以及平臺運維。本書從零開始逐一講解大數(shù)據(jù)體系中的各種技術(shù),通過豐富的實戰(zhàn)案例闡述重點、難點知識,為初學(xué)者進入大數(shù)據(jù)領(lǐng)域打好基礎(chǔ)。書中各個項目設(shè)計合理,在每個項目開頭設(shè)置導(dǎo)讀,首先介紹知識點,然后緊跟實踐操作,最后在每個項目末尾通過課后
"本書是“新一代人工智能系列教材”之一,全面、詳細地介紹數(shù)據(jù)科學(xué)的基本問題、前沿技術(shù)及應(yīng)用系統(tǒng)。本書共分為11章。第1章概述數(shù)據(jù)科學(xué),介紹數(shù)據(jù)科學(xué)的現(xiàn)有技術(shù)與工具;第2章介紹數(shù)據(jù)治理,包括實體對齊、數(shù)據(jù)融合和數(shù)據(jù)清洗;第3章介紹數(shù)據(jù)定價,包括數(shù)據(jù)定價機制和模型定價機制;第4章至第7章介紹面向不同數(shù)據(jù)類型(地理空間數(shù)據(jù)、
本書編寫目的是向讀者介紹大數(shù)據(jù)技術(shù)的基本概念與應(yīng)用。本書一共10章,分別講述了大數(shù)據(jù)介紹、云計算與大數(shù)據(jù)、大數(shù)據(jù)架構(gòu)、大數(shù)據(jù)采集與清洗、大數(shù)據(jù)存儲、大數(shù)據(jù)分析、大數(shù)據(jù)可視化、大數(shù)據(jù)治理、大數(shù)據(jù)安全、大數(shù)據(jù)的商業(yè)應(yīng)用以及綜合實訓(xùn)。本書將理論與實踐操作相結(jié)合,通過大量的案例及書中的二維碼幫助讀者快速了解和應(yīng)用大數(shù)據(jù)分析相關(guān)
"本書旨在引導(dǎo)讀者全面了解分布式系統(tǒng)的核心原理、關(guān)鍵技術(shù)和實際應(yīng)用。全書分為9章,內(nèi)容包括分布式系統(tǒng)概述、理論基礎(chǔ)、基礎(chǔ)架構(gòu),以及分布式文件系統(tǒng)HDFS、分布式計算模型MapReduce、分布式協(xié)調(diào)服務(wù)ZooKeeper、分布式數(shù)據(jù)庫HBase和分布式消息系統(tǒng)Kafka的工作原理與應(yīng)用,最后提供兩個實戰(zhàn)項目,幫助讀者將
"本書在第1版的基礎(chǔ)上,進行了全面更新和擴充,旨在反映測控技術(shù)的**發(fā)展和國家戰(zhàn)略需求。全書共分9章,第1章簡要介紹測控系統(tǒng)的基本概念、系統(tǒng)構(gòu)成以及發(fā)展趨勢;第2章介紹現(xiàn)代測控系統(tǒng)的理論方法;第3章介紹各種新型傳感器的原理及應(yīng)用;第4章介紹基于網(wǎng)絡(luò)的測控技術(shù)與系統(tǒng);第5章介紹基于計算機視覺的測控技術(shù)與系統(tǒng);第6、7章分
"大數(shù)據(jù)分析包括查詢型分析、描述性分析、探索性分析、挖掘型分析等。本書介紹基于R語言的大數(shù)據(jù)分析解決方案。全書分3篇共18章。第1篇R語言,包括第1~10章,分別為R語言概覽、表達式、字符串與正規(guī)表達式、函數(shù)、向量、矩陣、數(shù)據(jù)框、列表、面向?qū)ο蟪绦蛟O(shè)計、數(shù)據(jù)存儲;第2篇可視化,包括第11、12章,分別為統(tǒng)計繪圖、圖形文
《數(shù)據(jù)凈界》是一本由行業(yè)資深人士組成的團隊撰寫的全面指南,旨在提供關(guān)于管理永久性和可持續(xù)性數(shù)據(jù)清除的詳盡指導(dǎo),同時確保符合監(jiān)管、法律和行業(yè)標準。本書深入探討了數(shù)據(jù)凈化的原因、方法和時機,強調(diào)了數(shù)據(jù)凈化作為IT運營中實現(xiàn)循環(huán)的重要組成部分。作者還討論了關(guān)于數(shù)據(jù)清除的幾個新標準,包括IEEE和ISO即將發(fā)布的標準數(shù)據(jù)凈化如