主要內容·大數據技術和Spark概述。·通過實例學習DataFrame、SQL、Dataset等Spark的核心API。·了解Spark的低級API實現,包括RDD以及SQL和DataFrame的執(zhí)行過程。·了解Spark如何在集群上運行。·Spar
本書以Python作為開發(fā)Spark應用程序的編程語言,系統介紹了Spark編程的基礎知識。全書共8章,內容包括大數據技術概述、Spark的設計與運行原理、Spark環(huán)境搭建和使用方法、RDD編程、SparkSQL、SparkStreaming、StructuredStreaming、SparkMLlib等。
現在已經有越來越多的行業(yè)和技術領域需要大數據分析系統,例如金融行業(yè)需要使用大數據系統進行信貸風控,零售、餐飲行業(yè)需要通過大數據系統進行輔助銷售決策,各種物聯網場景需要大數據系統持續(xù)聚合和分析時序數據,各大科技公司需要建立大數據分析中臺等等。《大數據綜合應用項目實戰(zhàn)/高等職業(yè)院;诠ぷ鬟^程項目式系列教材》為培養(yǎng)和開發(fā)大
借鑒現實世界的真實案例,本書將教你會你保護關鍵基礎設施系統所必需的方法和安全措施,同時將有助你加速識別這種特有的挑戰(zhàn)。本書首先介紹工業(yè)控制系統(ICS)技術,包括ICS架構、通信介質及協議等,接著介紹ICS(不)安全問題,然后剖析了個ICS相關的攻擊場景,ICS安全話題亦有涉獵,包括網絡分割、深度防御策略及保護方案等。
本書以數據挖掘項目的典型開發(fā)過程為線索,對數據挖掘的生命周期中的各個環(huán)節(jié),以及其中所涉及的概念、方法、技術和過程模型進行了全面細致的介紹。對于數據挖掘核心部分的典型基礎算法,通過細致的闡述、詳盡的示例和充分的討論,深入地展示了數據挖掘算法的內涵,以便讀者認知、學習和掌握。本書系統地介紹了數據挖掘原理、算法和應用的相關知
內容介紹這是一本從原理與實踐角度全面講解InfluxDB的著作,由架構師、InfluxDB技術專家撰寫,融入了作者構建千億級監(jiān)控大數據平臺的工程實踐經驗。從生態(tài)、應用場景、功能使用、源碼分析等角度對InfluxDB進行了深入的講解,包含9個企業(yè)級實戰(zhàn)案例,100余示例,300余條命令和語法詳解,能幫助讀者從零開始,徹底
本書介紹基于西門子機電一體化概念設計(NXMCD)模塊的生產線數字孿生制作與調試技術,主要內容分為兩部分:第壹部分(第1~6 章)為機電一體化概念設計建模技術,包括簡單幾何體的三維建模、機電對象運動設置,以及過程控制與協同設計等技術,涵蓋了基本機電對象、運動副、耦合副、傳感器、運行時參數、運行時表達式、運行時行為、信
本書的主題是數據壓縮,也就是用最緊湊的方式來表示數據。本書先講解了5類數據壓縮算法,即變長編碼、統計壓縮、字典編碼、上下文模型和多上下文模型,然后介紹了香農的信息論,以及怎樣通過各種方法來突破熵,如統計編碼、自適應統計編碼、字典轉換、上下文數據轉換、數據建模等。本書還討論了數據壓縮中的一些要點,如多媒體數據壓縮和通用壓
本書結合控制基礎、控制技術和控制工程的一體化知識體系,介紹了過程控制基礎知識(含控制系統基礎、控制建;A、檢測技術基礎等)、過程控制主體知識(含檢測技術和控制系統)、控制工程應用案例的內容。全書知識點遞進關系清晰:控制基礎—檢測技術—控制建模—簡單控制—復雜控制—先進控制—計算機控制—過程案例應用,各章給出思考和練習
重點闡述了數據管理的重要性,數據管理面臨的挑戰(zhàn),DAMA的數據管理原則,數據倫理,數據治理,數據生命周期管理的規(guī)劃及設計,數據賦能和數據維護,使用和增強數據,數據保護、隱私、安全和風險管理,元數據管理,數據質量管理,以及現在應該怎么辦,能夠幫助企業(yè)管理層在了解和執(zhí)行數據管理的過程中不致迷失在技術術語的迷宮之中。