会员   密码 您忘记密码了吗?
1,488,350 本书已上架      购物流程 | 常见问题 | 联系我们 | 关于我们 | 用户协议

有店 App


当前分类

浏览历史

当前位置: 首页 > 电脑资讯 > 资料库/大数据 > Spark學習手冊
Spark學習手冊
上一张
Spark學習手冊
下一张
prev next

Spark學習手冊

作者: Holden Karau,Andy Konwinski,Patrick Wendell,Matei Zaharia
出版社: 歐萊禮
出版日期: 2016-09-05
商品库存: 点击查询库存
以上库存为海外库存属流动性。
可选择“空运”或“海运”配送,空运费每件商品是RM14。
配送时间:空运约8~12个工作天,海运约30个工作天。
(以上预计配送时间不包括出版社库存不足需调货及尚未出版的新品)
市场价格: RM79.10
本店售价: RM70.40
促销价: RM67.24
剩余时间: 请稍等, 正在载入中...
购买数量:
collect Add to cart Add booking
详细介绍 商品属性 商品标记
內容簡介

  現今無論在任何領域,資料都逐漸地變大,你該如何有效率的對他們進行處理?此書介紹了Apache Spark,一個開放原始碼叢集運算系統。它使資料可以更快速的寫入以及執行。藉由Spark,你可以透過簡易的Pyhon,Java,或是Scala的API進行快速的大量資料處理。

  此書為Spark的開發者親自撰寫,可以讓資料科學家以及工程師立即應用書中的知識展開工作。讀者將學會如何透過數行的程式碼進行一個平行處理的工作。本書涵蓋了基礎的批次工作到串流處理以及機器學習等相關的應用。

  .讓讀者可以快速地了解Spark,例如:分散式資料集、記憶體快取、以及交互式介面等。
  .利用Spark內建的強大資料庫,包含Spark SQL、Spark Streaming以及MLib。
  .使用一個Spark程式框架即可取代混合多種工具如Hive、Hadoop、Mahout以及Strom。
  .學習透過Spark進行交互式、批次、以及串流式的應用程式開發
  .與諸多資料來源進行連接,包含HDFS、HIVE、JSON以及S3
  .學習資料切割以及共享變數等進階議題

  “本書是我在大數據處理應用程式指南推薦書單中的第一名” --Ben. Lorica資料科學家主席, O’Reilly Media


作者介紹

作者簡介

Holden Karau


  Holden Karau任職於Databricks的軟體開發工程師,活耀於開放原始碼專案,同時也是《Fast Data Processing with Spark》(Packt 出版社)的作者

Andy Konwinski

  Andy Konwinski是Databricks的共同創辦人,Apache Spark的提交者。同時也是Apache Mesos專案的共同建立人

Patrick Wendell

  Patrick Wendell是Databricks的共同創辦人,Apache Spark的提交者。他也維護許多Spark核心引擎的子專案。

Matei Zaharia

  Matei Zaharia是Databricks的CTO以及Apache Spark的建立人,他也因為此專案名列Apache副董事


目錄

Chapter 1 Spark 資料分析導論
Chapter 2 下載及開始使用 Spark
Chapter 3 RDD程式撰寫
Chapter 4 鍵值對 RDD 操作
Chapter 5 存取資料
Chapter 6 進階 Spar k程式撰寫
Chapter 7 在叢集執行 Spark
Chapter 8 Spark 調校與除錯
Chapter 9 Spark SQL
Chapter 10 Spark streaming
Chapter 11 MLlib 機器學習函式庫