本書是一本介紹大數據處理技術的專業圖書,力求提高讀者對大數據處理的認知水平和動手能力。本書首先介紹大數據技術的相關概念和發展歷程,從實踐的角度介紹Hadoop和Spark的安裝部署、編程基礎和使用方法;然後結合具體案例,重點介紹Spark RDD、Spark SQL、Spark Streaming、Spark GraphFrame等的應用思路和方法,並通過具體代碼,讓讀者更好地感受大數據處理技術的效果。
本書既可以作為高等院校計算機、大數據等相關專業的教材,也可以作為大數據技術相關從業人員的參考書,還可作為零基礎人員學習Hadoop和Spark技術的入門圖書。
許桂秋,北京中科特瑞科技有限公司運營總監,主要研究方向為大數據、人工智能技術,已出版《大數據導論》《Python編程基礎與應用》《NoSQL數據庫原理與應用》《數據挖掘與機器學習》等圖書。