![]() ![]() |
數(shù)據采集與預處理技術應用 讀者對象:本書適合作為高等院校大數(shù)據、云計算、計算機和軟件專業(yè)相關課程的教材,或是相關領域培訓機構的培訓教材
本書共有九章,從數(shù)據采集與預處理概述開始,介紹了大數(shù)據環(huán)境的搭建,并對數(shù)據采集與數(shù)據預處理的技術方法進行了系統(tǒng)介紹。數(shù)據采集的內容包括Flume日志數(shù)據采集、Kafka日志數(shù)據采集、Fluentd與Logstach等一系列數(shù)據采集技術;數(shù)據預處理的內容包括網絡爬蟲采集Web數(shù)據、Python數(shù)據預處理技術、Kettle數(shù)據處理技術、Pig和OpenRefine這些數(shù)據預處理技術。旨在讓讀者了解并基本掌握當下主要的數(shù)據采集與預處理技術、工具,以及它們的使用方法。
你還可能感興趣
我要評論
|