会员   密码 您忘记密码了吗?
1,573,407 本书已上架      购物流程 | 常见问题 | 联系我们 | 关于我们 | 用户协议

有店 App


当前分类

商品分类

浏览历史

当前位置: 首页 > 简体书 > 從0到1:Python數據分析
從0到1:Python數據分析
上一张
下一张
prev next

從0到1:Python數據分析

作者: 莫振傑
出版社: 人民郵電出版社
出版日期: 2022-06-01
商品库存: 点击查询库存
以上库存为海外库存属流动性。
可选择“空运”或“海运”配送,空运费每件商品是RM14。
配送时间:空运约8~12个工作天,海运约30个工作天。
(以上预计配送时间不包括出版社库存不足需调货及尚未出版的新品)
定价:   NT539.00
市场价格: RM96.90
本店售价: RM86.24
促销价: RM85.27
剩余时间: 请稍等, 正在载入中...
购买数量:
collect Add to cart Add booking
详细介绍 商品属性 商品标记
內容簡介

作者根據自己多年的前後端開發經驗,站在零基礎讀者的角度,詳盡介紹了Pytho數據分析的基礎知識,以及大量的開發技巧,全書圍繞著“數據分析三劍客(NumPy、Pandas、Matplotlib)”進行細緻的介紹。這三款工具的知識點多,本書儘量系統細緻地介紹精華的知識點,以便為讀者構建一個完善的知識體系,並且為後續的工作打下堅實的基礎。每一章後面的實戰題以及練習題,經過精心設計,可以鍛煉讀者的數據分析實戰能力,對於鞏固基礎以及鍛煉技術是有幫助的。


作者介紹

莫振傑

畢業于暨南大學信科院電腦科學與技術專業,從事前後端開發4年多,開發過綠葉學習網、廣州智慧工程研究會網站、大量線上應用工具及其他各種類型網站,著有多本程式設計書且銷量過萬,現為綠葉學習網的站長,該網站用於分享其在前後端開發中的一些經驗,其製作的前後端開發線上教程在互聯網引起廣泛關注,每一個教程廣受網友稱讚與推崇。


目錄

前言 xvii

第一部分 NumPy篇
第1章 數據分析概述 3
1.1 數據分析簡介 3
1.1.1  數據科學是什麼? 3
1.1.2 數據分析是什麼? 4
1.1.3 應該學些什麼? 4
1.2  課程介紹 6
1.2.1 課程說明 6
1.2.2 常見問題 6
1.3 使用 VSCode 7
1.3.1 安裝 VSCode 7
1.3.2 安裝外掛程式 8
1.3.3 運行代碼 9
第2章 NumPy基礎 11
2.1 NumPy是什麼? 11
2.2 創建數組 12
2.2.1 基本方法 12
2.2.2 隨機數組 18
2.2.3 數組與列表的區別 21
2.3 數組屬性 22
2.4 元素操作 24
2.4.1 訪問元素 25
2.4.2 修改元素 26
2.4.3 添加元素 26
2.4.4 刪除元素 28
2.4.5 切片 29
2.5 數組操作 31
2.5.1 修改形狀 31
2.5.2 修改維度 33
2.5.3 翻轉數組 34
2.5.4 數組去重 34
2.5.5 合併數組 35
2.5.6 分割數組 37
2.6 各種運算 39
2.6.1 基本運算 39
2.6.2 比較運算 41
2.6.3 標量運算 42
2.6.4 數學函數 43
2.6.5 統計函數 45
2.7 遍歷數組 53
2.8 大小排序 55
2.9 本章練習 57
第3章 NumPy進階 58
3.1 淺拷貝和深拷貝 58
3.1.1 淺拷貝 58
3.1.2 深拷貝 59
3.2 axis的值 60
3.3 廣播機制 61
3.3.1 維數不同 61
3.3.2 維數相同 63
3.3.3 標量運算 64
3.4 讀寫文件 65
3.4.1 讀取文件 65
3.4.2 寫入文件 66
3.5 矩陣簡介 67
3.5.1 全0矩陣 68
3.5.2 全1矩陣 69
3.5.3 單位矩陣 69
3.5.4 隨機矩陣 70
3.6 本章練習 71

第二部分 Pandas篇
第4章 Pandas簡介 75
4.1 Pandas是什麼? 75
4.2 Series 76
4.2.1 創建Series 76
4.2.2 Series的屬性 78
4.2.3 獲取某行的值 78
4.2.4 深入瞭解 79
4.3 DataFrame 79
4.3.1 創建DataFrame 79
4.3.2 DataFrame的屬性 83
4.3.3 深入瞭解 86
4.4 DataFrame的數據操作 88
4.4.1 訪問數據 88
4.4.2 修改數據 95
4.4.3 添加數據 96
4.4.4 刪除數據 98
4.5 遍歷行列 101
4.5.1 遍歷行 101
4.5.2 遍歷列 102
4.6 深入瞭解 103
4.7 本章練習 105
第5章 獲取數據 107
5.1 數據分析流程 107
5.2 讀寫數據簡介 108
5.3 讀寫JSON 109
5.3.1 JSON簡介 109
5.3.2 讀取JSON 110
5.3.3 寫入JSON 111
5.4 讀寫CSV 113
5.4.1 CSV簡介 113
5.4.2 讀取CSV 114
5.4.3 寫入CSV 116
5.5 讀寫Excel 117
5.5.1 Excel簡介 117
5.5.2 讀取Excel 118
5.5.3 寫入Excel 119
5.6 讀寫HTML 120
5.7 深入文件讀取 122
5.7.1 分塊讀取 122
5.7.2 唯讀取一部分 124
5.8 讀取數據庫 125
5.8.1 安裝MySQL 125
5.8.2 安裝Navicat for MySQL 129
5.8.3 讀取MySQL 134
5.9 本章練習 136
第6章 篩選數據 137
6.1 篩選數據簡介 137
6.2 獲取行、列:loc[]、iloc[]和df[] 138
6.2.1 獲取行 138
6.2.2 獲取列 139
6.3 重新索引:reindex() 141
6.3.1 語法簡介 141
6.3.2 深入瞭解 143
6.4 獲取首尾數據:head()和tail() 145
6.5 隨機抽樣:sample() 147
6.6 邏輯比較 149
6.6.1 語法簡介 149
6.6.2 深入瞭解 152
6.7 過濾操作 155
6.7.1 query() 155
6.7.2 filter() 157
6.8 模式匹配 159
6.9 本章練習 162
第7章 處理數據 164
7.1 處理數據簡介 164
7.2 操作行名和列名 165
7.2.1 設置某一列為行名 165
7.2.2 重置行名 166
7.2.3 修改行名和列名 168
7.3 類型轉換 171
7.3.1 針對DataFrame 171
7.3.2 針對某一列 174
7.4 行列轉置:T 175
7.5 大小排序:sort_values() 176
7.6 數據排名:rank() 179
7.7 數據替換:replace() 181
7.8 數據移動:shift() 183
7.9 數據清洗 185
7.9.1 缺失值 186
7.9.2 重複值 192
7.9.3 異常值 196
7.10 數據合併 197
7.10.1 軸向合併:concat() 198
7.10.2 主鍵合併:merge() 203
7.10.3 行列連接:join() 207
7.10.4 縱向合併:append() 208
7.11 字串處理 209
7.11.1 獲取長度:len() 210
7.11.2 統計次數:count() 211
7.11.3 去除空格:strip() 212
7.11.4 替換字串:replace() 213
7.11.5 分割字串:split() 214
7.11.6 重複字串:repeat() 215
7.11.7 連接列:cat() 216
7.11.8 大小寫轉換 219
7.11.9 判斷類型 220
7.11.10 判斷包含 221
7.12 自訂函數 222
7.12.1 map() 222
7.12.2 apply() 224
7.12.3 applymap() 226
7.13 實戰題:處理天氣數據 227
7.14 實戰題:拆分數據 229
7.15 本章練習 230
第8章 分析數據 232
8.1 分析數據簡介 232
8.2 基本統計函數 232
8.2.1 求和:sum() 233
8.2.2 統計個數:count() 235
8.2.3 求 值:max()與min() 236
8.2.4 求中位數:median() 238
8.2.5 求眾數:mode() 239
8.2.6 求平均數:mean() 240
8.2.7 求方差:var() 241
8.2.8 求標準差:std() 242
8.2.9 求分位數:quantile() 243
8.3 其他統計函數 244
8.3.1 統計取值種類 244
8.3.2 統計取值個數 245
8.3.3 求變化百分比 246
8.3.4 求 值的行名 247
8.4 整體情況 247
8.4.1 describe() 248
8.4.2 info() 248
8.5 聚合函數:agg() 249
8.6 數據分組 252
8.6.1 基本語法 252
8.6.2 統計分析 256
8.7 實戰題:求平均壽命 258
8.8 本章練習 259
第9章 時間序列 260
9.1 時間序列概述 260
9.1.1 時間序列簡介 260
9.1.2 轉換類型 261
9.1.3 獲取日期 264
9.1.4 索引與切片 266
9.2 重採樣:resample() 268
9.2.1 降採樣 268
9.2.2 升採樣 271
9.3 移動計算:rolling() 273
9.4 分組器:Grouper() 274
9.5 實戰題:求每個月的銷量總和 276
9.6 本章練習 277
第10章 技術 279
10.1 透視表 279
10.1.1 透視表簡介 279
10.1.2 統計函數 281
10.2 交叉表 282
10.3 層次化索引 284
10.3.1 層次化索引簡介 284
10.3.2 常用操作 286
10.4 離散化處理 292
10.4.1 離散化簡介 292
10.4.2 常用參數 293
10.5 啞變數處理 296
10.6 實戰題:創建透視表 298
10.7 本章練習 299
第11章 其他操作 300
11.1 廣播機制 300
11.2 索引物件 301
11.3 inplace參數 304
11.4 缺失值 306
11.5 實戰題:統計每一列的缺失值個數 307
11.6 本章練習 308

第三部分 Matplotlib篇
第12章 基礎圖表 313
12.1 Matplotlib簡介 313
12.2 基本繪圖(折線圖) 315
12.2.1 基本語法 315
12.2.2 定義樣式 317
12.3 通用設置 325
12.3.1 畫布樣式 325
12.3.2 定義標題 326
12.3.3 定義圖例 330
12.3.4 刻度標籤 332
12.3.5 刻度範圍 335
12.3.6 格線 338
12.3.7 輔助線 340
12.3.8 參考區域 343
12.3.9 注釋文本(有指向) 345
12.3.10 注釋文本(無指向) 347
12.4 通用樣式 350
12.5 散點圖 350
12.5.1 基本語法 350
12.5.2 定義樣式 352
12.5.3 氣泡圖 354
12.6 直條圖 356
12.6.1 基本語法 356
12.6.2 直條圖 358
12.6.3 橫條圖 361
12.7 長條圖 362
12.7.1 基本語法 362
12.7.2 定義樣式 364
12.8 餅狀圖 366
12.8.1 基本語法 366
12.8.2 定義樣式 367
12.8.3 圓環圖 372
12.9 實戰題:繪製氣溫折線圖 373
12.10 實戰題:流覽器所占市場份額直條圖 375
第13章 圖表 378
13.1  圖表簡介 378
13.2 箱線圖 378
13.2.1 基本語法 378
13.2.2 樣式定義 381
13.3 面積圖 387
13.3.1 基本語法 387
13.3.2 面積圖 388
13.4 棉棒圖 389
13.4.1 基本語法 389
13.4.2 定義樣式 390
13.5 熱力圖 393
13.5.1 基本語法 393
13.5.2 定義樣式 394
13.6 子圖表 395
13.6.1 基本語法 395
13.6.2 實際案例 398
13.7 實戰題:使用箱線圖查找異常值 399
13.8 實戰題:繪製每月銷量的棉棒圖 401

第四部分 工具篇
第14章 Jupyter Notebook 407
14.1 Jupyter Notebook簡介 407
14.2 Jupyter Notebook的使用 408
14.2.1 安裝Anaconda 409
14.2.2 運行Jupyter Notebook 409
14.3 應用場景 411
14.4 常用技巧 414
14.4.1 問號查詢 414
14.4.2 輸出多個變數 415
14.4.3 讀取文件 417

第五部分 附錄
附錄A 讀寫文件(Pandas) 422
附錄B 統計函數(Pandas) 423
附錄C 繪圖函數(Matplotlib)424