会员   密码 您忘记密码了吗?
1,580,247 本书已上架      购物流程 | 常见问题 | 联系我们 | 关于我们 | 用户协议

有店 App


当前分类

商品分类

浏览历史

当前位置: 首页 > 简体书 > 數據挖掘原理(第3版)
數據挖掘原理(第3版)
上一张
下一张
prev next

數據挖掘原理(第3版)

作者: (英)麥克斯·布拉默
出版社: 清華大學出版社
出版日期: 2019-09-01
商品库存: 点击查询库存
以上库存为海外库存属流动性。
可选择“空运”或“海运”配送,空运费每件商品是RM14。
配送时间:空运约8~12个工作天,海运约30个工作天。
(以上预计配送时间不包括出版社库存不足需调货及尚未出版的新品)
定价:   NT479.00
市场价格: RM86.11
本店售价: RM76.64
购买数量:
collect Add to cart Add booking
详细介绍 商品属性 商品标记
內容簡介

深入探討重要的資料採擷技術。所謂資料採擷,即從資料中自動提取隱含和潛在有用的資訊;該技術正越來越多地用於商業、科學和其他應用領域。該書濃墨重彩地描述分類、關聯規則挖掘和聚類。
  
普通讀者可通過該書自學資料採擷“黑匣子”內部的基本原理,並瞭解如何合理地選擇商業資料採擷包。學者和資深科研人員可通過該書瞭解前沿技術並進一步推動該領域的發展。
 
該書在上一版的基礎上進行擴展,透徹講解適用於平穩資料的H-Tree演算法,以及適用於時間相關資料(概念漂移)的CDH-Tree演算法。


作者介紹

麥克斯·布拉默(Max Bramer),是英國樸資茅斯大學資訊技術系榮譽教授、IFIP副主席、英國電腦學會AI專家組主席。
  
自從“資料採擷”“資料庫中的知識發現”“大資料”和“預測分析”等技術興起以來,Max積極參與了多個資料採擷專案,尤其是與資料自動分類相關的專案。Max發表了大量技術文章,曾撰寫Research and Development in Intelligent Systems等著作。Max具有多年的本科和研究生教學經驗。


目錄

第1章 數據採擷簡介
1.1 數據爆炸
1.2 知識發現
1.3 數據採擷的應用
1.4 標籤和無標籤數據
1.5 監督學習:分類
1.6 監督學習:數值預測
1.7 無監督學習:關聯規則
1.8 無監督學習:聚類

第2章 用於挖掘的數據
2.1 標準制定
2.2 變數的類型
2.3 數據準備
2.4 缺失值
2.4.1 丟棄實例
2.4.2 用最頻繁值/平均值替換
2.5 減少屬性個數
2.6 數據集的UCI存儲庫
2.7 本章小結
2.8 自我評估練習

第3章 分類簡介:樸素貝葉斯和
最近鄰演算法
3.1 什麼是分類
3.2 樸素貝葉斯分類器
3.3 最近鄰分類
3.3.1 距離測量
3.3.2 標準化
3.3.3 處理分類屬性
3.4 急切式和懶惰式學習
3.5 本章小結
3.6 自我評估練習

第4章 使用決策樹進行分類
4.1 決策規則和決策樹
4.1.1 決策樹:高爾夫示例
4.1.2 術語
4.1.3 degrees數據集
4.2 TDIDT演算法
4.3 推理類型
4.4 本章小結
4.5 自我評估練習

第5章 決策樹歸納:使用熵進行屬性選擇
5.1 屬性選擇:一個實驗
5.2 替代決策樹
5.2.1 足球/無板籃球示例
5.2.2 匿名數據集
5.3 選擇要分裂的屬性:使用熵
5.3.1 lens24數據集
5.3.2 熵
5.3.3 使用熵進行屬性選擇
5.3.4 資訊增益最大化
5.4 本章小結
5.5 自我評估練習

第6章 決策樹歸納:使用頻率表進行屬性選擇
6.1 實踐中的熵計算
6.1.1 等效性證明
6.1.2 關於零值的說明
6.2 其他屬性選擇標準:多樣性基尼指數
6.3 X2屬性選擇準則
6.4 歸納偏好
6.5 使用增益比進行屬性選擇
6.5.1 分裂資訊的屬性
6.5.2 總結
6.6 不同屬性選擇標準生成的規則數
6.7 缺失分支
6.8 本章小結
6.9 自我評估練習

第7章 估計分類器的預測精度
7.1 簡介
7.2 方法1:將數據劃分為訓練集和測試集
7.2.1 標準誤差
7.2.2 重複訓練和測試
7.3 方法2:K-折交叉驗證
……
第8章 連續屬性
第9章 避免決策樹的過度擬合
第10章 關於熵的更多資訊
第11章 歸納分類的模組化規則
第12章 度量分類器的性能
第13章 處理大量數據
第14章 集成分類
第15章 比較分類器
第16章 關聯規則挖掘Ⅰ
第17章 關聯規則挖掘Ⅱ
第18章 關聯規則挖掘
第19章 聚類
第20章 文本挖掘
第21章 分類流數據Ⅰ
第22章 分類流數據Ⅱ:時間相關數據
附錄
參考文獻