本書使用MPI標準介紹了資料科學中的高性能計算,説明讀者瞭解分散式存儲模型中的並行程式設計的知識。
全書分為兩部分,第一部分(第1~6章)基於消息傳遞介面介紹高性能計算,內容包括:阻塞與非阻塞的點對點通信、鎖死、全域通信函數(廣播、散播等)、協同計算(歸約)的基本概念;互聯網路的拓撲結構(環、環面和超立方體)以及相應的全域通信程式;基於分散式記憶體的並行排序及其實現,涵蓋相關平行線性代數知識;MapReduce模型。
第二部分(第7~11章)介紹電腦集群中的高性能資料分析,內容包括:資料聚類技術(平面劃分聚類、層次聚類);基於k-NN的有監督分類;核心集以及相關降維技術;圖演算法(稠密子圖、圖同構檢測)。
每章章末附有各種難度的練習和參考文獻,可供讀者進行自測和深入學習。本書適合作為“高性能計算”相關課程的本科生教材。
弗蘭克·尼爾森(Frank Nielsen),巴黎綜合理工學院教授,負責教授研究生電腦視覺和圖形學方面的課程以及本科生的演算法和Java課程。他是Sony電腦科學實驗室研究員。