本書分為10章,其中第1~9章探討了排序、推薦系統(tǒng)、聚類、線性回歸等內(nèi)容,每章都以一個具體的實際問題開始,其主要目的是激發(fā)對某一特定大數(shù)據(jù)分析技術的研究。接下來探討其背后的數(shù)學原理——包括重要的定義、輔助陳述和得出的結(jié)論。案例研究有助于將所學知識應用于跨學科的環(huán)境中,包括對逐步任務的描述和有用的提示。每章之后都配有習題
討論大數(shù)據(jù)技術時,首先需要了解大數(shù)據(jù)的基本處理流程,主要包括數(shù)據(jù)采集、存儲、分析和結(jié)果呈現(xiàn)等環(huán)節(jié)。數(shù)據(jù)無處不在,互聯(lián)網(wǎng)網(wǎng)站、政務系統(tǒng)、零售系統(tǒng)、辦公系統(tǒng)、自動化生產(chǎn)系統(tǒng)、監(jiān)控攝像頭、傳感器等,每時每刻都在不斷產(chǎn)生數(shù)據(jù)。這些分散在各處的數(shù)據(jù),需要采用相應的設備或軟件進行采集。采集到的數(shù)據(jù)通常無法直接用于后續(xù)的數(shù)據(jù)分析,因
本書共分為六個部分:基礎入門、研究設計和基礎工具、文本挖掘基礎、人文社會科學與文本分析、計算機科學與文本挖掘、寫作和展示,在內(nèi)容安排上由淺入深、循序漸進。相較于單一且詳盡的方法教程,本書的目的更多是在于指導學生運用社會世界的文本數(shù)據(jù)來設計一項可行的社會科學研究。本書涵蓋了文本挖掘研究多個方面的關鍵問題,包括網(wǎng)絡抓取和爬
大數(shù)據(jù)技術與應用發(fā)展不僅改變著網(wǎng)絡信息環(huán)境,而且決定數(shù)據(jù)的存在形態(tài)與數(shù)字信息資源的分布和利用結(jié)構(gòu),直接關系到用戶的認知需求表達與數(shù)字信息交互機制。在這一背景下,本書從大數(shù)據(jù)技術基礎、數(shù)據(jù)內(nèi)容管理和數(shù)字信息利用出發(fā),按照大數(shù)據(jù)應用與服務基礎構(gòu)架進行理論和實踐的歸納;通過基本問題的分析和實證探索,圍繞大數(shù)據(jù)需求、數(shù)字資源形
本書以工業(yè)機器人集成應用為核心,對智能制造系統(tǒng)中常見的伺服、倉儲、分揀、打磨、視覺檢測等工程模塊的圖紙方案、仿真測試、參數(shù)配置、程序編寫及數(shù)據(jù)交互的集成調(diào)試流程進行了詳細的闡述。本書全面對接“工業(yè)機器人集成應用”1+X職業(yè)技能等級證書(中級)標準,實訓載體為北京華航唯實機器人科技股份有限公司的CHL-KH11型職業(yè)技能
本教材立足“大數(shù)據(jù)”的時代背景,面向企業(yè)數(shù)字化轉(zhuǎn)型升級對數(shù)字化人才的需求,堅持大數(shù)據(jù)通識教育核心理念,采用理論與實踐相結(jié)合的方式,選取了六個項目,助力讀者提升大數(shù)據(jù)分析相關的數(shù)字技能與數(shù)字素養(yǎng),培養(yǎng)學生的大數(shù)據(jù)意識、大數(shù)據(jù)思維、大數(shù)據(jù)安全和大數(shù)據(jù)基本處理能力。本教材根據(jù)行業(yè)企業(yè)大數(shù)據(jù)的實際應用和高職學生認知規(guī)律,選取了
本書以項目任務為載體串聯(lián)知識與技能,介紹基于SparkSQL技術的大數(shù)據(jù)分析方法,培養(yǎng)學習者使用SparkSQL技術解決實際數(shù)據(jù)分析問題的能力,主要內(nèi)容有大數(shù)據(jù)分析概述、實踐環(huán)境準備、學生信息處理分析、房產(chǎn)大數(shù)據(jù)分析與探索、電商大數(shù)據(jù)分析與探索、Zepplin數(shù)據(jù)可視化。在實現(xiàn)任務的過程中詳細闡述了Scala語言基礎、
本書從初學者的角度詳細介紹大數(shù)據(jù)的核心技術。全書共11章,包括緒論、Linux的基礎操作、Hadoop大數(shù)據(jù)處理架構(gòu)、HDFS分布式文件系統(tǒng)、MapReduce分布式計算框架、ZooKeeper分布式協(xié)調(diào)服務、YARN資源管理器、HBase分布式數(shù)據(jù)庫、Hive數(shù)據(jù)倉儲、PySpark數(shù)據(jù)處理與分析及綜合案例。此外,本
本書介紹的先進傳感器主要是21世紀以來發(fā)展或興起的新型傳感器件,其共同特點是具有更高的靈敏度、更強的智能化、更大的集成度、更廣的應用面,并且具有極為廣闊的發(fā)展前景。本書介紹新型結(jié)型光電傳感器、CMOS圖像傳感器、電荷耦合器件、半導體光子探測器、超導光子探測器、熱紅外傳感器、機器視覺傳感器、光纖傳感器、智能化集成傳感器等
架構(gòu)大數(shù)據(jù)系統(tǒng)涉及的技術和工具種類繁多,但技術和工具背后的大數(shù)據(jù)處理需求和解決問題的思維邏輯卻恒久不變。本書采用軟件工程化方法,從大數(shù)據(jù)架構(gòu)的需求出發(fā),籍由理性和常識的指引,推導和梳理大數(shù)據(jù)架構(gòu)之術(大數(shù)據(jù)處理的基本原理和技術方法),進而討論大數(shù)據(jù)架構(gòu)之器(具體軟件工具的功能、設計、實現(xiàn)以及使用方法),建立大數(shù)據(jù)架構(gòu)教