本書(shū)共12章。第1章簡(jiǎn)要介紹DeepSeek的技術(shù)架構(gòu)、本地部署與在線開(kāi)發(fā)環(huán)境,為后續(xù)分析奠定技術(shù)基礎(chǔ)。第2~4章聚焦多源數(shù)據(jù)獲取、數(shù)據(jù)清洗及預(yù)處理,提供標(biāo)準(zhǔn)化操作流程與代碼實(shí)例。第5-8章介紹描述性統(tǒng)計(jì)、頻數(shù)分析、相關(guān)性分析、線性/曲線/邏輯回歸、K-Means聚類、時(shí)間序列分析等核心算法,結(jié)合GDP分析、商品評(píng)論挖
本書(shū)共分為8章,每一章都圍繞完整的項(xiàng)目展開(kāi),涵蓋Spark的各個(gè)重要組件。包括認(rèn)識(shí)Spark、Scala語(yǔ)法應(yīng)用、SparkCore數(shù)據(jù)分析、SparkSQL結(jié)構(gòu)化數(shù)據(jù)處理、Spark、流式數(shù)據(jù)處理,Spark結(jié)構(gòu)化流式處理、Spark機(jī)器學(xué)習(xí)應(yīng)用、社交軟件運(yùn)營(yíng)數(shù)據(jù)分析,逐步提升讀者的技術(shù)水平和應(yīng)用能力。每個(gè)項(xiàng)目由多個(gè)
本書(shū)精心編排為15章,內(nèi)容包括Spark簡(jiǎn)介、Spark集群環(huán)境部署、Spark編程體驗(yàn)、RDD深度解讀、RDD的Shuffle詳解、Spark共享變量、Spark序列化和線程安全、Spark內(nèi)存管理機(jī)制、SparkSQL簡(jiǎn)介、SparkSQL抽象編程詳解、SparkSQL自定義函數(shù)、SparkSQL源碼解讀、Spar
本書(shū)提供了完整的數(shù)據(jù)資產(chǎn)對(duì)內(nèi)運(yùn)營(yíng)與對(duì)外運(yùn)營(yíng)的實(shí)施路徑,從數(shù)據(jù)治理、數(shù)據(jù)資產(chǎn)入表到數(shù)據(jù)資產(chǎn)場(chǎng)景化應(yīng)用,再到完整的數(shù)據(jù)資產(chǎn)運(yùn)營(yíng),每個(gè)環(huán)節(jié)都有明確的實(shí)施路徑及重點(diǎn)、難點(diǎn)。通過(guò)系統(tǒng)化的講解,確保讀者在理解每個(gè)概念的同時(shí),能夠掌握如何落地實(shí)施,避免出現(xiàn)知識(shí)斷層的情況。 數(shù)據(jù)資產(chǎn)入表、管理和運(yùn)營(yíng)的核心是數(shù)據(jù)資產(chǎn)本身,法律、財(cái)務(wù)、評(píng)
知識(shí)圖譜以三元組形式組織現(xiàn)實(shí)世界的各種事實(shí),并通過(guò)圖的形式揭示事實(shí)間語(yǔ)義關(guān)聯(lián),由于其完善的知識(shí)組織和存儲(chǔ)方式,且建模更加靈活、表達(dá)能力更強(qiáng),逐漸拓展到語(yǔ)言理解、智能問(wèn)答、推薦系統(tǒng)等領(lǐng)域應(yīng)用。工程應(yīng)用場(chǎng)景中時(shí)序信息相關(guān)的動(dòng)態(tài)性是知識(shí)圖譜關(guān)鍵及主要特征,融合時(shí)序相關(guān)信息的動(dòng)態(tài)知識(shí)推理對(duì)于提高知識(shí)圖譜推薦、問(wèn)答等應(yīng)用的精準(zhǔn)性
本書(shū)介紹典型控制系統(tǒng)的性能要求及控制設(shè)計(jì)的基本方法,并給出相應(yīng)的仿真與分析。全書(shū)共6章,第1~4章從經(jīng)典控制設(shè)計(jì)和魯棒綜合控制策略這類可推廣至常見(jiàn)的二階系統(tǒng)的控制設(shè)計(jì)方法開(kāi)始,以柔性系統(tǒng)的特性與特殊控制問(wèn)題為例,向讀者展示兩種控制方案在類似柔性系統(tǒng)設(shè)計(jì)中的應(yīng)用。第5、6章介紹一種非線性控制方案,給出一種高精度要求的空間
隨著數(shù)據(jù)量的爆炸式增長(zhǎng),大數(shù)據(jù)存儲(chǔ)技術(shù)在數(shù)據(jù)科學(xué)、人工智能、云計(jì)算等領(lǐng)域的重要性日益凸顯。大數(shù)據(jù)不僅為個(gè)人生活、企業(yè)經(jīng)營(yíng),以及國(guó)家與社會(huì)的發(fā)展帶來(lái)了機(jī)遇,也帶來(lái)了挑戰(zhàn)。本書(shū)是一本大數(shù)據(jù)入門(mén)圖書(shū),主要介紹了Hive、HBase、Sqoop等內(nèi)容。本書(shū)采用理論與實(shí)踐相結(jié)合的講解方式,旨在幫助讀者擺脫枯燥的理論學(xué)習(xí),注重實(shí)際
本書(shū)以項(xiàng)目實(shí)戰(zhàn)為核心載體,采用任務(wù)驅(qū)動(dòng)教學(xué)模式,系統(tǒng)且深入地解析Hadoop生態(tài)圈中主流的大數(shù)據(jù)開(kāi)發(fā)技術(shù)。全書(shū)精心編排7個(gè)項(xiàng)目,從Hadoop的基礎(chǔ)理論入門(mén),逐步深入到Hadoop集群環(huán)境配置、Hadoop分布式文件系統(tǒng)、MapReduce分布式計(jì)算框架,再到MapReduce離線數(shù)據(jù)處理、基于Hive的離線數(shù)據(jù)分析,
本書(shū)是面向大數(shù)據(jù)人才培養(yǎng)的高等學(xué)校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)系列教材中的一本,通過(guò)把數(shù)據(jù)思維融入全書(shū)各章,并通過(guò)Python實(shí)現(xiàn)相關(guān)案例,使抽象的數(shù)據(jù)思維具體化,從而加深讀者對(duì)數(shù)據(jù)的感性認(rèn)識(shí),提高讀者對(duì)數(shù)據(jù)思維的理解能力。本書(shū)首先介紹了大數(shù)據(jù)相關(guān)的概念,然后根據(jù)數(shù)據(jù)處理流程的邏輯順序,對(duì)大數(shù)據(jù)平臺(tái)和大數(shù)據(jù)開(kāi)發(fā)進(jìn)行了深入介
本書(shū)系統(tǒng)地介紹了數(shù)據(jù)挖掘算法、原理及基于Python的實(shí)現(xiàn)方法,將算法原理與案例相結(jié)合,幫助讀者建立數(shù)據(jù)挖掘領(lǐng)域的理論基礎(chǔ),提升基本的實(shí)踐技能。本書(shū)共15章,主要包括數(shù)據(jù)挖掘概述、Python環(huán)境的搭建、數(shù)據(jù)預(yù)處理、數(shù)據(jù)集劃分與交叉驗(yàn)證評(píng)分、回歸、分類、集成學(xué)習(xí)、參數(shù)調(diào)優(yōu)、降維、特征選擇與特征聯(lián)合、流水線、聚類、關(guān)聯(lián)規(guī)