發現數據之美：數據分析原理與實踐

有店 App

当前分类

商品分类

浏览历史

当前位置: 首页 > 简体书 > 發現數據之美：數據分析原理與實踐

详细介绍商品属性商品标记

內容簡介

大數據時代已經來臨，這將引起深刻的行業變革。但是，大數據的真意在於數據分析，即從繁多的數據中找出洞見，並將其應用於實際決策中，以產生更明智的決策。這是一個看起來簡單、做起來較難的事情。本書從一個自底向上的角度，全面地闡述了數據分析所涉及的知識和技術，對於經典算法和工具的介紹也不止於泛泛而談，而是加入了作者的經驗和理解。所謂自底向上的角度，即從數據分析實踐開始時所需要的數據准備、數據探查、數據再處理等，到經典的統計分析和數據挖掘算法及應用，還講述了模型的部署，優化技術的引入，最終到決策自動化。

本書對企業管理者、數據分析從業者及高校的學生都有參考意義。管理者能看到一個較全面的數據分析的闡述，明確自身的需求；從業者能看到經驗的總結及經典工具的使用；高校學生能看到數據分析所涉及的知識，對數據分析有一個全面的認識。

彭鴻濤，畢業於西安交通大學軟件學院，自2008年加入IBM SPSS部門以來，一直擔任SPSS Analytical Decision Management 架構師和技術主管。由於工作需要，對數理統計和數據挖掘有長期的使用和研究，對SPSS的產品及解決方案有深入理解，特別擅長於將具體的數據分析技術應用到實際的商業問題解決中。除此之外，對圖像分析也有較深入的實踐和應用。目前，正致力於大數據的應用。聶磊，瑞典查爾姆斯理工大學應用信息技術和可靠計算機系統雙碩士，PMP。2008 年加入IBM SPSS部門，現為IBM Analytical Decision Management團隊主管及資深開發人員，從事數據挖掘和企業級業務分析與優化解決方案等產品的研發、部署實施和集成架構咨詢工作，對數據挖掘和決策支持有深刻的認識和理解，對SPSS的產品及解決方案有深入的研究。目前專注於大數據和雲計算等技術的研究。

第1章業務分析是一個蓬勃發展的方向
1.1業務分析是什麽
1.2業務分析的應用現狀
1.3如何應用業務分析
1.4大數據與業務分析
1.5我們還在等什麽

第2章開始我們的旅程——從數據談起
2.1我們討論的數據結構
2.1.1行（Row）是什麽
2.1.2列（Column）是什麽
2.1.3多少行數據才合適
2.1.4我們需要什麽樣的列
2.2 Statistics和Modeler的基本知識
2.3數據導入（Loading Data）
2.4數據探查（Data Exploring）
2.4.1正態分布（Normal Distribution）
2.4.2數據探查的常見統計量
2.4.3數據可視化
2.5 本章小結

第3章在分析之前，還需要數據預處理
3.1 數據的問題
3.2數據校驗
3.2.1驗證規則
3.2.2驗證數據
3.2.3數據審計（Data Audit）
3.2.4識別異常數據
3.3數據集成（Data Integration）
3.3.1 在Statistics中進行數據集成
3.3.2在Modeler中進行數據集成
3.4數據轉換（Data Transformation）
3.4.1分箱（Binning）
3.4.2數據調整（Data Rescale）
3.4.3數據重新編碼（Recode）
3.5自動數據准備
3.5.1 Statistics中的自動數據准備
3.5.2 Modeler中的自動數據准備
3.6本章小結

第4章經典分析——統計學的魅力
4.1 隨機變量及分布
4.2數理統計導引
4.3 參數估計
4.3.1 點估計
4.3.2區間估計
4.4假設檢驗
4.4.1 正態分布檢驗和檢驗
4.4.2非參數檢驗
4.5相關分析
4.6方差分析
4.7回歸分析
4.7.1 線性回歸分析
4.7.2 自動化線性回歸分析
4.7.3廣義線性模型
4.7.4廣義線性混合模型（Generalized Linear Mixed Mode，GLMM）
4.8本章小結

第5章我想預測未來
5.1 數據挖掘的技術分類
5.1.1有監督的建模技術
5.1.2無監督的建模技術
5.1.3 Feature Selection對於分類的意義
5.1.4查看建模的結果
5.2決策樹
5.2.1 C5.0算法
5.2.2分類和回歸樹
5.2.3卡方自動交互檢測法（CHAID）
5.2.4快速、無偏、高效的統計樹（QUEST）
5.2.5交互式的決策樹構建方式
5.3 決策表
5.3.1 決策表算法的設置
5.3.2交互式決策表的生成方式
5.4貝葉斯網絡
5.4.1一些基本概念
5.4.2 IBM SPSS的做法
5.5神經網絡（Neural Networks）
5.5.1神經網絡是什麽
5.5.2 SPSS神經網絡算法
5.6支持向量機（SupportVectorMachine）
5.6.1 什麽是線性分類器
5.6.2 Modeler中的支持向量機
5.7最近相鄰（Nearest Neighbor）
5.8我該選用哪種算法
5.9如何評價預測結果
5.9.1基本指標
5.9.2 Gains
5.9.3 Lift
5.9.4 Response
5.9.5 Profit
5.9.6 ROI
5.10本章小結

第6章我想發現聚類（Cluster）

發現數據之美：數據分析原理與實踐


作者：	彭鴻濤
出版社：	電子工業出版社
ISBN：	9787121235580
出版日期：	2014-08-01
商品库存：	点击查询库存
	以上库存为海外库存属流动性。可选择“空运”或“海运”配送，空运费每件商品是RM14。配送时间：空运约8~12个工作天，海运约30个工作天。（以上预计配送时间不包括出版社库存不足需调货及尚未出版的新品）
定价：	NT450.00
市场价格：	RM80.90
本店售价：	RM72.00
促销价：	RM67.96
剩余时间：	请稍等, 正在载入中...

购买数量：

作者	彭鴻濤
出版社	電子工業出版社
ISBN	9787121235580
出版日期	2014-08-01
开本
页数	310
装帧	無
规格	16 / 無 / 普級
版次	1-1
版本（简/繁）