>
大數據時代是一個充滿著機會和挑戰的時代,僅需要有一個得心應手的工具--MLlib就是這個工具。 本書的主要目的是介紹如何使用MLlib進行資料採擷。MLlib是Spark中最核心的部分,它是Spark機器學習函數庫,可以執行在分散式叢集上的資料採擷工具。吸引了大量程式設計和開發人員進行相關內容的學習與開發。 本書理論內容由淺而深,採取實例和理論相結合的方式,內容全面而詳盡,適合Spark MLlib初學者、大數據採擷、大數據分析的工作人員。