在大數據背景下,數據的決策支持作用愈加顯著。本書在論述數據系統(tǒng)概念的基礎上,引入系統(tǒng)科學與系統(tǒng)工程的理論和方法,創(chuàng)新性地提出數據系統(tǒng)工程這一概念及其研究內容體系。本書主要包括理論篇、實證篇和展望篇三個部分,分別對數據系統(tǒng)工程的基礎內涵、應用案例和未來趨勢進行了探討,可為豐富系統(tǒng)科學與系統(tǒng)工程、大數據決策支持等提供研究借
高性能分布式SQL查詢引擎Presto可用于對不同的數據源執(zhí)行快速的交互式分析。這本實用指南將帶你學習如何對Hive、Cassandra、關系數據庫或專有數據存儲中的數據進行分析。分析師、軟件工程師、生產工程師可以從中學習Presto的管理、使用甚至開發(fā)。初由Facebook開發(fā)的開源軟件Presto如今已被Netfl
本書為北京高等教育精品教材。全書系統(tǒng)全面地介紹了光電檢測技術的基礎理論、半導體光電檢測器理及特性、半導體光電檢測器件及應用、光電信號檢測電路、光電直接檢測系統(tǒng)、光外差檢測系統(tǒng)、光纖傳感檢測技術、光電信號的數據采集與微機接口、光電檢測技術的典型應用。內容編排注重理論與實際相結合,一方面注重光電檢測技術的基本理論和原理的介
隨著互聯(lián)網技術的普及,數據產生的速度加快,數據規(guī)模越來越龐大,企業(yè)對數據分析師的需求也隨之增加。數據分析師需要做好日常的數據收集與積累的工作,通過數據分析師制定適合企業(yè)的發(fā)展計劃,幫助企業(yè)在激烈的市場競爭中贏得主動權,實現(xiàn)跨越發(fā)展。目前世界領先的企業(yè)中,大多已經簡歷了數據分析部門,知名互聯(lián)網公司如IBM、谷歌等企業(yè)尤其
綜合利用近代各種先進技術,采用光電方法對多種光的、非光的物理量進行檢測是光電檢測技術的基本內容。全書從基本原理到工程應用,系統(tǒng)地介紹了光電檢測技術的組成,主要組成部分的功能、實際應用和當前發(fā)展的情況。主要內容包括光電檢測技術基礎、光源及輻射源、光電探測器及其校正技術、光學系統(tǒng)及專用光學元件、光電信號的變換及檢測技術、非
本書按照教育部新的職業(yè)教育教學改革要求,以培養(yǎng)自動生產線的崗位技能為核心進行編寫,注重專業(yè)綜合技術的應用和工程實踐能力的提高,主要內容包括:認識自動生產線、供料站安裝與調試、加工站安裝與調試、裝配站安裝與調試、分揀站系統(tǒng)安裝與調試、輸送站系統(tǒng)調試,以及整機運行等。本書的內容體系完整典型、結構清晰、圖文并茂,易于學生學習
大數據已深深滲透于人們工作和生活的方方面面。然而,大數據從來都不是以“技術”為其**底色,基于數據科學的創(chuàng)新應用,同樣需要其他領域深度融合。本書闡述了培養(yǎng)具有大數據素養(yǎng)的綜合型人才所需要的相關知識儲備。本書不僅介紹大數據處理流程中的技術圖譜,而且更側重地討論了與數據科學相關的歷史、哲學及倫理學,以便于讀者拓展跨領域的數
本書的編寫目的是向讀者介紹數據清洗技術的基本概念與應用。全書共10章,分別為數據清洗概述、文件格式、Web數據抽取、網絡爬蟲、Kettle數據清洗、數據遷移、文本數據處理、Python數據清洗、DataCleaner數據分析與清洗以及數據清洗綜合實訓。本書將理論與實踐操作相結合,通過大量的案例幫助讀者快速了解和應用數據
Kettle是一款國外開源的ETL工具,純Java編寫,無須安裝,功能完備,數據抽取高效穩(wěn)定。本書介紹并演示如何用Kettle完成Hadoop數據倉庫上的ETL過程,所有的描繪場景與實驗環(huán)境都是基于Linux操作系統(tǒng)的虛擬機。全書共分10章,主要內容包括ETL與Kettle的基本概念、Kettle安裝與配置、Kettl
ApacheFlink是一個框架和分布式處理引擎,用于對無界和有界數據流進行有狀態(tài)的計算,廣泛應用于大數據相關的實際業(yè)務場景中。本書是一本從零開始講解Flink的入門教材,學習本書需要有Java編程基礎。本書共分10章,內容包括Flink開發(fā)環(huán)境搭建、Flink架構和原理、時間和窗口、狀態(tài)管理和容錯機制、數據類型與序列