![]() ![]() |
Kettle構(gòu)建Hadoop ETL系統(tǒng)實(shí)踐
Kettle是一款國(guó)外開(kāi)源的ETL工具,純Java編寫(xiě),無(wú)須安裝,功能完備,數(shù)據(jù)抽取高效穩(wěn)定。
本書(shū)介紹并演示如何用Kettle完成Hadoop數(shù)據(jù)倉(cāng)庫(kù)上的ETL過(guò)程,所有的描繪場(chǎng)景與實(shí)驗(yàn)環(huán)境都是基于Linux操作系統(tǒng)的虛擬機(jī)。全書(shū)共分10章,主要內(nèi)容包括ETL與Kettle的基本概念、Kettle安裝與配置、Kettle對(duì)Hadoop的支持、建立ETL示例模型、數(shù)據(jù)轉(zhuǎn)換與裝載、定期自動(dòng)執(zhí)行ETL作業(yè)、維度表技術(shù)、事實(shí)表技術(shù),以及Kettle并行、集群與分區(qū)技術(shù)。 本書(shū)既適合大數(shù)據(jù)分析系統(tǒng)開(kāi)發(fā)、數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)設(shè)計(jì)與開(kāi)發(fā)、DBA、架構(gòu)師等相關(guān)技術(shù)人員閱讀,也適合高等院校和培訓(xùn)機(jī)構(gòu)人工智能與大數(shù)據(jù)相關(guān)專業(yè)的師生參考。
你還可能感興趣
我要評(píng)論
|