《Spark性能優化實戰:突破性能瓶頸,遨遊數據重洋》全面、系統、深入地介紹Apache Spark性能優化的相關技術和策略,涵蓋從Spark性能優化的基礎知識到核心技術,再到應用實踐的方方面面。本書不但系統地介紹各種監控工具的使用,而且還結合實戰案例,詳細介紹Spark性能優化的各種經驗和技巧,提升讀者的實際應用技能。
《Spark性能優化實戰:突破性能瓶頸,遨遊數據重洋》共8章。第1章從性能優化的基本概念出發,介紹Spark的基礎知識,並介紹如何進行性能優化;第2章介紹Spark性能優化的幾個方面,包括程序設計優化、資源優化、網絡通信優化和數據讀寫優化等;第3章深入介紹Spark任務執行過程優化;第4章介紹Spark SQL性能優化;第5章結合實戰案例全面解析Spark性能優化的核心技術與應用;第6章詳細介紹不同應用場景的性能優化策略;第7章介紹Spark集成Hadoop、Kafka和Elasticsearch使用時的性能優化,從而提供更實用的Spark性能提升方案;第8章介紹Spark應用程序開發與優化,以及集群管理實踐。
《Spark性能優化實戰:突破性能瓶頸,遨遊數據重洋》內容豐富,講解深入淺出,適合Apache Spark開發人員、數據工程師和數據科學家閱讀,也適合需要處理大規模數據集和對Spark性能優化感興趣的技術人員閱讀,還可作為高等院校大數據專業的教材和相關培訓機構的教學用書。
謝雪葵,資深研發工程師,CCF會員,阿誠網絡創始人。有多年的軟件設計和開發經驗,專註于大數據技術與服務。近年來主持和參與多個大型銀行和互聯網公司的大數據項目,累積了豐富的大數據項目開發及性能優化經驗。為多家企業提供技術支持,幫助其降低成本和提高效率。