会员   密码 您忘记密码了吗?
1,572,652 本书已上架      购物流程 | 常见问题 | 联系我们 | 关于我们 | 用户协议

有店 App


当前分类

浏览历史

当前位置: 首页 > 电脑资讯 > 概论/科技趋势 > 比Hadoop+Python還強:Spark MLlib機器學習實作
比Hadoop+Python還強:Spark MLlib機器學習實作
上一张
比Hadoop+Python還強:Spark MLlib機器學習實作
下一张
prev next

比Hadoop+Python還強:Spark MLlib機器學習實作

作者: 王曉華
出版社: 佳魁資訊
出版日期: 2016-10-03
商品库存: 点击查询库存
以上库存为海外库存属流动性。
可选择“空运”或“海运”配送,空运费每件商品是RM14。
配送时间:空运约8~12个工作天,海运约30个工作天。
(以上预计配送时间不包括出版社库存不足需调货及尚未出版的新品)
定价:   NT480.00
市场价格: RM73.01
本店售价: RM64.98
促销价: RM64.25
剩余时间: 请稍等, 正在载入中...
购买数量:
collect Add to cart Add booking
详细介绍 商品属性 商品标记
內容簡介

  大數據時代是一個充滿著機會和挑戰的時代,僅需要有一個得心應手的工具--MLlib就是這個工具。

  本書的主要目的是介紹如何使用MLlib進行資料採擷。MLlib是Spark中最核心的部分,它是Spark機器學習函數庫,可以執行在分散式叢集上的資料採擷工具。吸引了大量程式設計和開發人員進行相關內容的學習與開發。

  本書理論內容由淺而深,採取實例和理論相結合的方式,內容全面而詳盡,適合Spark MLlib初學者、大數據採擷、大數據分析的工作人員。
 


作者介紹


目錄

前言

Chapter 01  星星之火
1.1 大數據時代
1.2 大數據分析時代
1.3 簡單、優雅、有效-- 這就是Spark
1.4 核心-- MLlib
1.5 星星之火,可以燎原
1.6 小結

Chapter 02  Spark 安裝和開發環境設定
2.1 Windows 單機模式Spark 安裝和設定
2.2 經典的WordCount
2.3 小結

Chapter 03  RDD 詳解
3.1 RDD 是什麼
3.2 RDD 工作原理
3.3 RDD 應用API 詳解
3.4 小結 .

Chapter 04  MLlib 基本概念
4.1 MLlib 基本資料型態
4.2 MLlib 數理統計基本概念
4.3 小結

Chapter 05  協作過濾演算法
5.1 協作過濾
5.2 相似度度量
5.3 MLlib 中的交替最小平方法(ALS 演算法)
5.4 小結

Chapter 06 MLlib 線性回歸理論與實戰
6.1 隨機梯度下降演算法詳解
6.2 MLlib 回歸的過擬合
6.3 MLlib 線性回歸實戰
6.4 小結

Chapter 07 MLlib 分類實戰
7.1 邏輯回歸詳解
7.2 支援向量機詳解
7.3 單純貝氏詳解
7.4 小結

Chapter 08決策樹與保序回歸
8.1 決策樹詳解
8.2 保序回歸詳解
8.3 小結

Chapter 09 MLlib 中分群詳解
9.1 分群與分類
9.2 MLlib 中的Kmeans 演算法
9.3 高斯混合分群
9.4 快速反覆運算分群
9.5 小結

Chapter 10 MLlib 中連結規則
10.1 Apriori 頻繁項集演算法
10.2 FP-growth 演算法
10.3 小結

Chapter 11資料降維
11.1 奇異值分解(SVD)
11.2 主成分分析(PCA)
11.3 小結

Chapter 12特徵分析和轉換
12.1 TF-IDF
12.2 詞向量化工具
12.3 以卡方檢定為基礎的特徵選擇
12.4 小結

Chapter 13 MLlib 實戰演練-- 鳶尾花分析
13.1 建模說明
13.2 資料前置處理和分析
13.3 長與寬之間的關係-- 資料集的回歸分析
13.4 使用分類和分群對鳶尾花資料集進行處理
13.5 最後的判斷-- 決策樹測試
13.6 小結