大數據技術讓我們以一種的方式,對海量數據進行分析,從中獲得有巨大價值的產品和服務,最終形成變革之力。本書圍繞Hadoop和Spark兩個主流大數據技術進行講解,主要內容包括Hadoop環境配置、Hadoop分散式文件系統(HDFS)、Hadoop分散式計算框架MapReduce、Hadoop資源調度框架YARN與Hadoop新特性、Hadoop分散式資料庫HBase、數據倉庫Hive、大數據離線處理輔助系統、Spark Core、Spark SQL、Spark Streaming等知識。本書緊密結合實際應用,運用大量案例說明和實踐,提煉含金量十足的開發經驗。另外,本書配以多元的學習資源和支持服務,包括視頻教程、案例素材下載、學習交流社區、討論組等學習內容,為讀者帶來全方位的學習體驗。
肖睿任職于北京課工場教育科技有限公司。課工場是專註互聯網教育的生態平台,匯聚了中國和北美數百位來自知名互聯網企業的行業大咖,向尋求就業和技術提升的人群提供直播、錄播、面授等多模式教學場景,並通過遍布全國的線下服務中心提供成熟的學習服務,形成完善的「互聯網教育」解決方案。同時,課工場也為高校、企業、行業提供教育技術賦能,依托Transformer智能教育生態平台,打造智慧校園、企業大學、行業培訓的教育場景,提供一站式教育解決方案。