本書作為《大數據導論》(ISBN9787302500704)的配套實訓教材,旨在幫助讀者夯實基礎知識,還原企業真實業務,提升實操能力。本書從大數據開發所需要的基礎編程知識出發,首先闡述Linux開發環境中常用的命令。接著介紹數據清洗工具Kettle的基礎操作以及常見的數據視覺化效果,如圓形圖、柱狀圖、折線圖、平行座標圖等。
最後通過數據清洗、數據視覺化、數據挖掘等熱門大數據技術在環境、金融、電商等行業的具體應用,給讀者提供真實的大數據體驗情景。本書提供了豐富的項目實訓案例,結合實際情況進行真實的行業數據研究,從而培養實用型人才的專業項目能力。本書既可作為培養應用型人才的課程教材,也可作為相關開發人員的自學教材和參考手冊。
劉鵬,清華大學博士畢業,現任南京雲創大資料科技股份有限公司總經理,兼任中國大資料應用聯盟人工智慧專家委員會主任、中國資訊協會教育分會人工智慧專家委員會主任、教育部全國普通高校畢業生就業創業指導委員會委員、第45屆世界技能大賽中國區雲計算選拔賽裁判長/專家指導組組長、2019年全國大學生資料建模比賽命題人、工信部雲計算研究中心專家。
李四明,副教授,系統分析師,獲得國家科技進步獎三等獎,擁有多項軟體著作專利。主持開發了醫院HIS系統、移動臨床系統、移動輸液系統、移動藥品即時監管系統、農民健康體檢協同系統,承擔過智慧城市、智慧社區的整體架構工作。