本書介紹大數(shù)據(jù)技術(shù)的基本概念和相應(yīng)的技術(shù)應(yīng)用。全書共為10章,分別是大數(shù)據(jù)介紹、云計(jì)算基礎(chǔ)、大數(shù)據(jù)架構(gòu)、數(shù)據(jù)采集、數(shù)據(jù)清洗、大數(shù)據(jù)存儲(chǔ)、大數(shù)據(jù)分析與挖掘、大數(shù)據(jù)可視化、大數(shù)據(jù)安全和大數(shù)據(jù)的行業(yè)應(yīng)用。本書將理論與實(shí)踐操作相結(jié)合,通過大量的案例幫助讀者快速了解和應(yīng)用大數(shù)據(jù)相關(guān)基本技術(shù),并對(duì)書中重要的、核心的知識(shí)點(diǎn)加大練習(xí)的
本書以面向應(yīng)用、面向?qū)崙?zhàn)為指導(dǎo)思想,緊扣企業(yè)技術(shù)人才培養(yǎng)的特點(diǎn),在知識(shí)點(diǎn)講解和實(shí)驗(yàn)中避免復(fù)雜的理論,使學(xué)生能快速上手體驗(yàn)、驗(yàn)證大數(shù)據(jù)處理的魅力,以激發(fā)學(xué)生的學(xué)習(xí)興趣。本書覆蓋了大數(shù)據(jù)生命周期主要技術(shù)要點(diǎn),全書共8章。第1章介紹大數(shù)據(jù)的產(chǎn)生和特點(diǎn)及思維的變革,第2章了解大數(shù)據(jù)生態(tài)環(huán)境,第3章-第7章是按照大數(shù)據(jù)的生命周期
該書通過對(duì)數(shù)據(jù)庫(kù)和信息系統(tǒng)中的數(shù)據(jù)與信息質(zhì)量的現(xiàn)狀和未來發(fā)展進(jìn)行充分、完整而全面的綜述,對(duì)組成數(shù)據(jù)與信息質(zhì)量研究核心的技術(shù)進(jìn)行了深入探討,包括對(duì)象識(shí)別、數(shù)據(jù)集成、錯(cuò)誤定位與糾正等,并在一個(gè)原創(chuàng)框架下對(duì)相關(guān)技術(shù)進(jìn)行比較研究。該書除了將數(shù)據(jù)與信息質(zhì)量作為獨(dú)立研究領(lǐng)域進(jìn)行系統(tǒng)描述,還包括了從其他領(lǐng)域借鑒的研究成果,如概率論、
本書采用項(xiàng)目驅(qū)動(dòng)方式,從理論到實(shí)踐,由淺入深地設(shè)計(jì)了17個(gè)項(xiàng)目,包括認(rèn)識(shí)大數(shù)據(jù)分析、Python數(shù)據(jù)分析工具、numpy數(shù)據(jù)分析和處理、Pandas數(shù)據(jù)分析和處理、Matplotlib數(shù)據(jù)分析可視化、基于HADOOP的數(shù)據(jù)分析和機(jī)器學(xué)習(xí)。
本書系統(tǒng)闡述了Pandas基礎(chǔ)知識(shí)、應(yīng)用原理,以及應(yīng)用流程和應(yīng)用技巧等實(shí)戰(zhàn)知識(shí)。全書共分為5篇:第一篇為入門篇(第1和2章),第二篇為基礎(chǔ)篇(第3和4章),第三篇為基礎(chǔ)強(qiáng)化篇(第5-7章),第四篇為進(jìn)階篇(第8-11章),第五篇為案例篇(第12章)。書中主要內(nèi)容包括Python簡(jiǎn)介、NumPy基礎(chǔ)、Pandas入門、數(shù)
這是一本從實(shí)戰(zhàn)角度解讀如何進(jìn)行智能數(shù)據(jù)分析及搭建智能數(shù)據(jù)分析平臺(tái)的工具書,目的是幫助讀者全面認(rèn)識(shí)并在實(shí)際工作中靈活使用智能數(shù)據(jù)分析,同時(shí)構(gòu)建可用的智能數(shù)據(jù)分析環(huán)境。本書不僅包含關(guān)于智能數(shù)據(jù)分析的基礎(chǔ)知識(shí),還包含進(jìn)行智能數(shù)據(jù)分析必備的方法、工具、案例,以及平臺(tái)的搭建方案。全書共分為8章。第1-2章在全面剖析了智能數(shù)據(jù)分析
《Offer來敲門大數(shù)據(jù)開發(fā)面試筆試精講在線真題實(shí)訓(xùn)視頻版》圍繞大數(shù)據(jù)開發(fā)的相關(guān)技術(shù),以大數(shù)據(jù)開發(fā)的基本要求為綱,以企業(yè)在筆試和面試中的試題為核心,從企業(yè)考核的角度組織內(nèi)容,并對(duì)這些試題加上了詳細(xì)的分析說明,以考促學(xué)!禣ffer來敲門大數(shù)據(jù)開發(fā)面試筆試精講在線真題實(shí)訓(xùn)視頻版》既包括Java、Python等基礎(chǔ)編程知識(shí)
本教材基于數(shù)據(jù)技術(shù)概念的提出,建立由數(shù)據(jù)生成、數(shù)據(jù)組織管理與數(shù)據(jù)信息汲取三個(gè)模塊構(gòu)成的數(shù)據(jù)技術(shù)應(yīng)用全流程體系框架。通過對(duì)計(jì)算機(jī)信息系統(tǒng)、抽樣技術(shù)與數(shù)據(jù)庫(kù)系統(tǒng)等基礎(chǔ)技術(shù)原理的概念化解讀,以及對(duì)網(wǎng)絡(luò)爬蟲與文本數(shù)據(jù)生成、SQL語(yǔ)言、數(shù)據(jù)預(yù)處理、回歸模型、Logistic建模、關(guān)聯(lián)規(guī)則、決策樹分類規(guī)則、K-平均聚類、神經(jīng)網(wǎng)絡(luò)、
本書主要內(nèi)容包括大數(shù)據(jù)概論、初識(shí)Hadoop、Linux基礎(chǔ)、Hadoop集群搭建、HDFS分布式文件系統(tǒng)、MapReduce分布式計(jì)算框架、以及項(xiàng)目實(shí)戰(zhàn)--美國(guó)新冠疫情covid-19分析。 本書將理論與實(shí)踐結(jié)合,補(bǔ)充相關(guān)Linux基礎(chǔ),注重大數(shù)據(jù)技術(shù)的系統(tǒng)性、實(shí)用性和先進(jìn)性,配有大量的應(yīng)用案例,不僅能夠幫助提高大
本書系統(tǒng)介紹了大數(shù)據(jù)技術(shù)與管理決策的基礎(chǔ)知識(shí)。內(nèi)容包括大數(shù)據(jù)決策的流程及方法、大數(shù)據(jù)處理的基礎(chǔ)架構(gòu)、大數(shù)據(jù)存儲(chǔ)與管理、大數(shù)據(jù)的采集與預(yù)處理、大數(shù)據(jù)處理的計(jì)算架構(gòu)、大數(shù)據(jù)分析與建模、大數(shù)據(jù)可視化、大數(shù)據(jù)治理、大數(shù)據(jù)在管理決策中的綜合應(yīng)用、大數(shù)據(jù)應(yīng)用倫理與法律問題、大數(shù)據(jù)管理決策的挑戰(zhàn)與趨勢(shì)等,能夠幫助讀者學(xué)習(xí)、了解大數(shù)據(jù)