首部關於網頁排名科學的著作,是搜索排序姊妹篇的一本。本書主要內容有:網絡搜索引擎簡介、網絡爬行、索引建立和查詢處理、通過歡迎度對網頁排名、PageRank的數學、PageRank模型中的參數、PageRank的敏感性、作為線性系統的PageRank問題、PageRank大規模實現中的問題、加速PageRank計算、更新PageRank向量、HITS網頁排名方法、網頁排名的其他鏈接方法、網絡信息檢索的未來、網絡信息檢索資源、數學指南、術語匯編、參考文獻、索引。
本書可作為數學、計算機、網絡技術、管理學和數據科學等專業領域科研人員和工程技術人員的參考書,也可作為教材使用。
前言
第1章 網絡搜索引擎簡介
1.1 信息檢索簡史
1.2 傳統信息檢索回顧
1.3 網絡信息檢索
第2章 網絡爬行、索引建立和查詢處理
2.1 網絡爬行
2.2 內容索引
2.3 查詢處理
第3章 通過歡迎度對網頁排名
3.1 1998年的情景
3.2 兩篇論文
3.3 查詢無關性
第4章 谷歌PageRank的數學
4.1 PageRank的原始求和公式
4.2 求和方程的矩陣表示
4.3 迭代過程問題
4.4 一點關於馬爾可夫鏈理論的介紹
4.5 基本模型的早期修正
4.6 PageRank向量的計算
4.7 谷歌矩陣的譜定理及其證明
第5章 PageRank模型中的參數
5.1 α因子
5.2 超鏈接矩陣H
5.3 跳轉矩陣E
第6章 PageRank的敏感性
6.1 對α的敏感性
6.2 對H的敏感性
6.3 對vT的敏感性
6.4 其他敏感性分析
6.5 有關敏感性的定理和證明
第7章 作為線性系統的PageRank問題
7.1 (I-αS)的性質
7.2 (I-αH)的性質
7.3 PageRank稀疏線性系統的證明
第8章 PageRank大規模實現中的問題
8.1 存儲問題
8.2 收斂准則
8.3 精度
8.4 懸掛結點
8.5 對后退按鈕建模
第9章 加速PageRank計算
9.1 一種自適應的冪法
9.2 外插
9.3 聚合
9.4 其他數值方法
第10章 更新PageRank向量
10.1 兩類更新問題及其發展歷程
10.2 重啟冪法
10.3 使用近似聚合進行近似更新
10.4 精確聚合
10.5 精確聚合與近似聚合的比較
10.6 利用迭代聚合進行更新
10.7 確定划分
10.8 結論
第11章 HITS網頁排名方法
11.1 HITS算法
11.2 HITS的實現
11.3 HITS的收斂性
11.4 HITS示例
11.5 HITS的優點與缺點
11.6 HITS與文獻統計學的關系
11.7 查詢無關HITS
11.8 加HITS
11.9 HITS的敏感性
第12章 網頁排名的其他鏈接方法
12.1 SALSA
12.2 混成排名方法
12.3 基於流量的排名
第13章 網絡信息檢索的未來
13.1 垃圾信息
13.2 個性化
13.3 聚類
13.4 智能體
13.5 趨勢與時間敏感搜索
13.6 隱私和審查
13.7 圖書館分類方式
13.8 數據融合
第14章 網絡信息檢索資源
14.1 入門階段的資源
14.2 用於嚴肅的科學研究的資源
第15章 數學指南
15.1 線性代數
15.2 佩隆弗羅貝尼烏斯定理
15.3 馬爾可夫鏈
15.4 佩隆補
15.5 隨機補
15.6 設限
15.7 聚合
15.8 去聚合
第16章 術語匯編
參考文獻
索引