会员   密码 您忘记密码了吗?
1,567,441 本书已上架      购物流程 | 常见问题 | 联系我们 | 关于我们 | 用户协议

有店 App


当前分类

浏览历史

当前位置: 首页 > 电脑资讯 > 资料库/大数据 > Spark大數據分析新利器:資料科學家與數據分析師非用不可的入門指南書
Spark大數據分析新利器:資料科學家與數據分析師非用不可的入門指南書
上一张
Spark大數據分析新利器:資料科學家與數據分析師非用不可的入門指南書
下一张
prev next

Spark大數據分析新利器:資料科學家與數據分析師非用不可的入門指南書

作者: Mohammed Gulle
出版社: 松崗
出版日期: 2016-11-18
商品库存: 点击查询库存
以上库存为海外库存属流动性。
可选择“空运”或“海运”配送,空运费每件商品是RM14。
配送时间:空运约8~12个工作天,海运约30个工作天。
(以上预计配送时间不包括出版社库存不足需调货及尚未出版的新品)
市场价格: RM80.00
本店售价: RM70.40
用户评价: comment rank 5
购买数量:
collect Add to cart Add booking
详细介绍 商品属性 商品标记
內容簡介

Scala函式X機器學習X圖形演算X程式監控
實戰大數據分析,用Spark優化運算效率與速度

  本書涵蓋了Spark專案的主要知識:
  Spark核心RDD
  Spark Shell互動式數據分析
  Spark Streaming即時資料串流
  Spark SQL查詢處理
  MLlib機器學習框架
  GraphX圖形處理

  除了以上基本Spark知識之外,還專闢一章介紹Scala,它除了是最熱門的函數式編程語言,也是Spark的原生語言。讀者將會學到使用Scala進行基礎函數編程,直接用它來寫出Spark應用程式。並且於最後特別提及Spark的三種叢集管理與Spark內建的網頁監控應用程式。

  書中還介紹其他可搭配Spark使用的大數據技術,如:HDFS、Avro、Pqrquet、Kafka、Cassandra、Hbase、Mesos...等。也提供了機器學習和圖學概念的介紹。

  如果想要將這本書發揮最大效益,就請嘗試動手鍵入書中的範例。用這些範例程式進行實驗,你將會覺得更加清楚明瞭。練習過書中的範例,在讀完這本書後將會成為一個有實力的Spark開發者。

本書特色

  透過上百場大數據相關研討會,萃取出業界人士常見問題之精華
  了解開發者在運用Spark時,可能需要使用的開發和測試工具
  涵蓋機器學習與圖形演算,強化大數據分析能力基礎
  適合軟體設計者、架構設計師、專案管理者、或是程式設計師閱讀


作者介紹

作者簡介

Mohammed Guller


  他是美國數據分析平台公司Glassbeam的首席架構師,主要工作是帶領開發高階預測分析系統。身為大數據和Spark的專家,他常受邀到許多大數據研討會演講。對於建立新產品、巨量資料分析、以及機器學習有著無比的熱情。

  過去20年來,Mohammed成功地從概念到發佈,開發出許多創新科技產品。在加入Glassbeam公司前,他是TrustRecs.com的創辦人,這間公司是他任職於IBM五年後創立的。而在加入IBM前,他也在許多高科技新創公司帶領開發新產品。

  Mohammed擁有美國加州大學柏克萊分校的商業管理碩士學位,以及印度古吉拉特大學RCC的電腦軟體碩士學位。


目錄

CHAPTER 01──大數據技術
Hadoop
資料序列化
分欄式儲存  
訊息系統
NoSQL
分散式SQL查詢引擎
總結

CHAPTER 02──Scala程式設計
函數式程式設計  
Scala基礎
可獨立執行的Scala應用程式
總結

CHAPTER 03── Spark核心
總覽
高階架構
應用程式的執行  
資料來源
應用程式介面
惰性操作
快取
Spark 工作
共用變數
總結

CHAPTER 04──使用Spark Shell進行互動式資料分析
起手式
REPL指令
將Spark Shell作為Scala Shell使用
數值分析
日誌分析
總結

CHAPTER 05──撰寫Spark應用程式
Spark中的Hello World
編譯並執行應用程式
監控應用程式
應用程式除錯
總結

CHAPTER 06──Spark Streaming
Spark Streaming簡介  
應用程式介面
完整的Spark Streaming應用程式
總結

CHAPTER 07──Spark SQL
Spark SQL簡介
效能
應用程式
應用程式介面
內建函數  
使用者自訂函數與使用者自訂彙整函數  
互動式分析範例
使用Spark SQL JDBC伺服器進行互動式分析  
總結

CHAPTER 08──Spark機器學習
介紹機器學習
Spark機器學習函式庫
MLlib函式庫概觀
The MLlib API
MLlib應用程式範例
Spark ML  
Spark ML應用程式範例
總結  

CHAPTER 09──Spark圖學處理
圖形簡介
GraphX簡介  
GraphX API  
總結  

CHAPTER 10──叢集管理器
獨立叢集管理器
Apache Mesos  
YARN
總結

CHAPTER 11──監控
監控獨立叢集  
監控Spark應用程式
總結