這是一部能指導零基礎的讀者快速掌握R語言並利用R語言進入數據科學領域的著作。兩位作者在R語言和數據科學領域有豐富的實踐經驗,首先是非常有針對性地講解了利用R語言進行數據處理需要掌握和使用的6大類17種工具,然後是結合這些工具的使用給出了5個典型的綜合性案例,幫助讀者迅速將理論與實踐融會貫通。
全書一共11章,邏輯上分為兩大部分:第一部分:R語言工具箱(第1-6章)首先從數據導入、數據清洗、數據計算、循環和迭代等幾個方面詳細講解了R語言中相關的各種常用的工具,然後深入地講解了R語言中的「超級瑞士軍刀」data.table包。掌握這部分內容,能滿足R語言數據處理中的基本需求。第二部分:數據科學實戰案例(第7-11章)第7章首先對數據科學從業者的現狀和未來應該掌握的技術和工具進行了介紹;第8-11章通過4個綜合性的案例講解了使用R語言進行數據處理和分析的一整套流程和方法,與第一部分的內容融會貫通。
劉健,資深R語言技術專家,數據科學工程師。在紐西蘭皇家植物與食品研究院工作,參與一項國際和兩項國家級研究項目,使用R語言開發完成氣象數據自動提取和模型文件自動化工具。由此參與編寫《LandscapeModelling and Decision Support》(在審)一書;獨立開發完成R語言程序包一個。該程序包主要針對模型軟體APSIMX的輸出數據進行整合及可視化;氣象數據自動化報告系統。使用R語言對紐西蘭不同地區的氣象數據進行自動獲取、歸集和可視化報告。科研上,作為第一作者發表期刊一篇,第一作者撰寫科研報告兩篇;作為R語言技術專家合作撰寫期刊一篇,合作撰寫科研報告16篇。
鄔書豪,資深R語言用戶和數據分析工程師,是數據科學領域10萬粉絲的知名公眾號人工智慧愛好者社區的負責人,公眾號文章閱讀量破百萬。喜歡用SQL、R和Python解決工作中的數據科學問題,致力於成為一名有深度行業實踐經驗積累的數據科學家。在天善智能社區開設有R語言視頻課程《kaggle十大案例精講課程》。