從簡單的Stormtopology示例出發,基於實際應用場景介紹Storm的基本功能,並詳細講解Trident和分布式狀態等高級概念,以及與Druid和Titan的集成模式。通過閱讀《大數據技術叢書:Storm分布式實時計算模式》,讀者將了解Storm和Trident的基本原理,並將這些原理和應用場景對應起來,解決實際問題。
前言
作者簡介
第1章 分布式單詞計數
1.1 Storm topology的組成部分——stream、spout和bolt
1.1.1 Storm
1.1.2 spout
1.1.3 bolt
1.2 單詞計數topology的數據流
1.2.1 語句生成bolt
1.2.2 語句分割bolt
1.2.3 單詞計割bolt
1.2.4 上報bolt
1.3 實現單詞計數top
1.3.1 配置開發環境
1.3.2 實現Sentence
1.3.3 實現語句分割bolt
1.3.4 實現單詞計割bolt
1.3.5 實現上報bolt
1.3.6 實現單詞計數topo
1.4 Storm的並發機制
1.4.1 WordCountTopology的並發機制
1.4.2 給topology增加woker
1.4.3 配置executor和task
1.5 理解數據流分組
1.6 有保障機制的數據處理
1.6.1 spout的可靠性
1.6.2 bolt的可靠性
1.6.3 可靠的單詞計數
總結
第2章 配置Storm集群
2.1 Storm集群的框架
2.1.1 理解nimbus守護進程
2.1.2 supervisor守護進程的工作方式
2.1.3 Apache ZooKeeper簡介
……
第3章 Trident和傳感器數據
第4章 實時趨勢分析
第5章 實時圖形分析
第6章 人工智能
第7章 整合Druid進行金融分析
第8章 自然語言處理
第9章 在Hadoop上部署Storm進行廣告分析
第10章 雲環境下的S