本書(shū)針對(duì)愿意加入大數(shù)據(jù)行業(yè)的初學(xué)者量身定做,以簡(jiǎn)練風(fēng)趣的語(yǔ)言介紹了大數(shù)據(jù)程核心技術(shù)及相關(guān)案例。內(nèi)容包括了數(shù)據(jù)的基本概念、Hadoop的安裝與配置、HDFS、基于Hadoop3的HDFS高可用、Zookeeper、MapReduce、YARN、Sqoop、KafKa、Redis,每個(gè)知識(shí)點(diǎn)配有可運(yùn)行的案例,同時(shí)結(jié)合企業(yè)實(shí)
本書(shū)從多個(gè)數(shù)據(jù)項(xiàng)目實(shí)例出發(fā),介紹爬蟲(chóng)、反爬蟲(chóng)的各種案例,使讀者了解到數(shù)據(jù)抓取和分析的完整過(guò)程。書(shū)中案例的難度由淺入深,以作者原創(chuàng)的代碼為主,不借助現(xiàn)成的框架,強(qiáng)調(diào)在數(shù)據(jù)采集過(guò)程中的發(fā)散思維,總結(jié)攻克反爬蟲(chóng)的思維模式,實(shí)現(xiàn)以低成本的方式得到想要的數(shù)據(jù)的愿望。最后,用一個(gè)“愛(ài)飛狗”的例子,為讀者展示如何從0到1地開(kāi)發(fā)一個(gè)大
線性延遲反饋控制使非線性系統(tǒng)產(chǎn)生了非常復(fù)雜的行為,包括混沌和分岔,延遲產(chǎn)生的混沌具有理論上的無(wú)窮維,可能通過(guò)簡(jiǎn)單的方法獲得超混沌吸引子。針對(duì)線性延遲反饋的混沌產(chǎn)生機(jī)理,包括局部分岔,全局分岔,拓?fù)漶R蹄等一系列問(wèn)題進(jìn)行了較為深入的分析,同時(shí)對(duì)混沌的應(yīng)用,如通信應(yīng)用,加密應(yīng)用和壓實(shí)機(jī)械中的應(yīng)用都進(jìn)行了深入的研究,這些研究成
隨著計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展和廣泛普及,互聯(lián)網(wǎng)已經(jīng)成為人類獲取知識(shí)的最大平臺(tái)。在爬取了Web網(wǎng)頁(yè)語(yǔ)料后,需要通過(guò)數(shù)據(jù)預(yù)處理和數(shù)據(jù)分析來(lái)獲取數(shù)據(jù)的價(jià)值,從而造福人類,推動(dòng)社會(huì)發(fā)展。本書(shū)主要是Web大數(shù)據(jù)預(yù)處理和數(shù)據(jù)分析的實(shí)戰(zhàn)指南,內(nèi)容包括三部分:基礎(chǔ)知識(shí)、基于Python的數(shù)據(jù)預(yù)處理、基于Python的數(shù)據(jù)分析
決策問(wèn)題中存在大量的冗余信息,而且很多信息都具有不確定性,面對(duì)這些雜亂無(wú)章的海量數(shù)據(jù),決策者需花費(fèi)大量時(shí)間分析,以至于可能錯(cuò)失決策良機(jī),因此研究具有不確定性的決策問(wèn)題中冗余信息約簡(jiǎn)是決策者亟待解決的關(guān)鍵問(wèn)題。目前軟集合方法能夠較好地處理不確定決策問(wèn)題,但軟集合約簡(jiǎn)方法目前還不完善,致使對(duì)海量數(shù)據(jù)很難做出決策。本書(shū)主要以
天津?yàn)I海迅騰科技集團(tuán)有限公司編著的《大數(shù)據(jù)高可用環(huán)境搭建與運(yùn)維(企業(yè)級(jí)人才培養(yǎng)解決方案十三五規(guī)劃教材)》主要涉及11個(gè)項(xiàng)目,即大數(shù)據(jù)分布式集群、分布式集群基礎(chǔ)配置、ZooKeeper分布式協(xié)調(diào)系統(tǒng)、Hadoop高可用、Hive分布式數(shù)據(jù)倉(cāng)庫(kù)工具、HBase分布式數(shù)據(jù)庫(kù)、大數(shù)據(jù)協(xié)作框架、Linux自動(dòng)化部署、Ambari
本書(shū)將大數(shù)據(jù)技術(shù)生態(tài)圈主流技術(shù)框架的應(yīng)用與發(fā)展、搭建Hadoop大數(shù)據(jù)分布式系統(tǒng)集群平臺(tái)、大數(shù)據(jù)分布式文件系統(tǒng)HDFS(HadoopDistributedFileSystem)、大數(shù)據(jù)分布式并行計(jì)算框架MapReduce、大數(shù)據(jù)汽車(chē)銷售數(shù)據(jù)統(tǒng)計(jì)分析項(xiàng)目5大模塊分為11章內(nèi)容進(jìn)行闡述。具體分布情況如下:第1章是大數(shù)據(jù)概論
本書(shū)采用理論與實(shí)踐相結(jié)合的方式,全面介紹了Hadoop大數(shù)據(jù)技術(shù)。主要內(nèi)容包括初識(shí)Hadoop大數(shù)據(jù)技術(shù)、Hadoop環(huán)境配置,分布式文件系統(tǒng)HDFS、資源調(diào)度框架YARN、分布式計(jì)算框架MapReduce、大數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)Hive、分布式數(shù)據(jù)庫(kù)HBase、查詢大型半結(jié)構(gòu)化數(shù)據(jù)集的語(yǔ)言Pig、分布式日志采集工具Flume
“第1章認(rèn)識(shí)商務(wù)智能”,解釋了BI的相關(guān)概念及理論基礎(chǔ);“第2章實(shí)施商務(wù)智能”,講述了BI項(xiàng)目的實(shí)施過(guò)程;“第3章分析商務(wù)智能案例”,展示了企業(yè)真實(shí)BI案例的實(shí)施細(xì)節(jié)、成果及價(jià)值所在;第4章至第6章為商務(wù)智能開(kāi)發(fā)工具;“第7章商務(wù)智能的應(yīng)用與發(fā)展趨勢(shì)”,介紹了BI的應(yīng)用及未來(lái)發(fā)展趨勢(shì)。
本書(shū)從系統(tǒng)的角度出發(fā),按照大數(shù)據(jù)處理流程的順序,全面介紹了大數(shù)據(jù)技術(shù)的基礎(chǔ)知識(shí),提升讀者對(duì)大數(shù)據(jù)的認(rèn)知。全書(shū)分3個(gè)邏輯層次,共9章。 本書(shū)作為大數(shù)據(jù)技術(shù)的基礎(chǔ)教材,目的不在于讓讀者對(duì)具體的某個(gè)技術(shù)平臺(tái)細(xì)節(jié)有很深的理解,而是盡量讓讀者體會(huì)整個(gè)大數(shù)據(jù)處理的技術(shù)流程,使讀者能夠掌握大數(shù)據(jù)技術(shù)的整體框架,能夠在未來(lái)的學(xué)習(xí)和工作