《Python機器學習》通過解釋數學原理和展示編程示例對機器學習進行了系統、全面的解析。《Python機器學習》共分為12章,內容涵蓋了機器學習以及Python語言的基礎知識、特徵工程的概念與操作技術、數據可視化技術的實現、監督學習及無監督學習演算法、文本分析、神經網路和深度學習、推薦系統的構建方法以及預測處理時間序列的方法等。閱讀《Python機器學習》能夠加深讀者對機器學習的認識和理解,從而達到理論與實踐相結合、學以致用的目的。《Python機器學習》適合Python程序員、數據分析人員、對機器學習感興趣的讀者以及機器學習領域的從業人員閱讀。
Abhishek Vijayvargia是一位數據科學家,他活躍在IT技術領域,並解決了與數據科學和機器學習相關的實時問題。他專註于數據分析,涉及的領域包括運輸業、政府工程、石油和天然氣以及物聯網等。他獲得了印度理工學院坎普爾分校的人工智慧專業碩士學位,關注方向是分散式機器學習、深度學習、流處理和區塊鏈。他擔任各種機器學習課題的導師,並進行其他演算法、數據方面的培訓。
第1章 走進機器學習
1.1 機器學習概述
1.2 機器學習過程
第2章 瞭解Python
2.1 為什麼選擇Python
2.2 下載和安裝Python
2.2.1 在Windows中安裝Python
2.2.2 Anaconda
2.3 **Python程式
2.4 Python基礎
2.5 資料結構與迴圈
第3章 特徵工程
3.1 什麼是特徵
3.2 為什麼執行特徵工程
3.3 特徵提取
3.4 特徵選擇
3.5 特徵工程方法——通用準則
3.5.1 處理數值特徵
3.5.2 處理分類特徵
3.5.3 處理基於時間的特徵
3.5.4 處理文本特徵
3.5.5 缺失數據
3.5.6 降維
3.6 用Python進行特徵工程
3.6.1 Pandas基本操作
3.6.2 常見任務
第4章 數據視覺化
4.1 折線圖
4.2 橫條圖
4.3 圓形圖
4.4 長條圖
4.5 散點圖
4.6 箱線圖
4.7 採用物件導向的方式繪圖
4.8 Seaborn
4.8.1 分佈圖
4.8.2 雙變數分佈
4.8.3 二元分佈的核密度估計
4.8.4 成對雙變數分佈
4.8.5 分類散點圖
4.8.6 小提琴圖
4.8.7 點圖
第5章 回歸
5.1 簡單回歸
5.2 多元回歸
5.3 模型評價
5.3.1 訓練誤差
5.3.2 泛化誤差
5.3.3 測試誤差
5.3.4 不可約誤差