本書將大數據技術生態圈主流技術框架的應用與發展、搭建Hadoop大數據分散式系統集群平台、大數據分散式文件系統HDFS(Hadoop Distributed File System)、大數據分散式並行計算框架MapReduce、大數據汽車銷售數據統計分析項目5大模塊分為11章內容進行闡述。具體分佈情況如下:第1章是大數據概論,介紹大數據的發展背景及基本概念;第2章是搭建Hadoop分散式集群;第3~6章是HDFS分散式文件系統入門、HDFS介面、HDFS的運行機制、Hadoop I/O流操作;第7~10章是初識MapReduce編程模型、MapReduce應用編程開發、MapReduce編程案例、MapReduce運行機制與YARN平台;第11章是汽車銷售數據統計分析項目實戰。
本書將理論與實踐相結合,介紹了大數據的核心技術,並通過介紹一個企業的開發項目,深入講解大數據技術在實際工作中的應用。
本書是為所有熱愛大數據、打算從事大數據相關工作的讀者而編寫的,適合有Java編程基礎的學習者參考使用,也適合作為高等院校、培訓機構的大數據技術教材。
楊力,原普開數據大數據架構師兼教學總監,新奧集團公司雲數據平台項目首席架構師,京東萬象大數據平台締造人之一,二六三網路通信反垃圾郵件系統平台項目經理。 現任瀋陽兄弟連教學總監。兄弟連是國內知名的教育培訓機構,目前已在新三板上市。其出版的細說系列,市場反映良好。