Mahout算法解析與案例實戰(zhàn)一書一般被簡稱為Mahout實戰(zhàn),關于這本書存在兩種比較明顯的評價,有人說本書是一本經(jīng)典的Mahout著作,而有人表示這本書前邊對于算法的介紹還比較好, 但是后面實戰(zhàn)部分太差了——甚至認為本書關于調用MAHOUT與HADOOP的平臺的接口什么的都沒講。正所謂,一千個讀者就有一千哈姆雷特,該書到底是好是壞,當然只有你看了之后才知道。本節(jié)內容東坡小編為大家整理帶來的是一份pdf格式高清中文電子版Mahout算法解析與案例實戰(zhàn),歡迎感興趣的朋友前來下載查閱!
Mahout算法解析與案例實戰(zhàn)目錄
第一部分 基礎篇
第1章 Mahout簡介 2
1.1 Mahout應用背景 2
1.2 Mahout算法庫 3
1.2.1 聚類算法 4
1.2.2 分類算法 5
1.2.3 協(xié)同過濾算法 6
1.2.4 頻繁項集挖掘算法 7
1.3 Mahout應用 7
1.4 本章小結 8
第2章 Mahout安裝配置 9
2.1 Mahout安裝前的準備 9
2.1.1 安裝JDK 10
2.1.2 安裝Hadoop 12
2.2 兩種安裝方式 20
2.2.1 使用Maven安裝 20
2.2.2 下載發(fā)布版安裝 22
2.3 測試安裝 22
2.4 本章小結 24
第二部分 算法篇
第3章 聚類算法 26
3.1 Canopy算法 26
3.1.1 Canopy算法簡介 26
3.1.2 Mahout中Canopy算法實現(xiàn)原理 28
3.1.3 Mahout的Canopy算法實戰(zhàn) 29
3.1.4 Canopy算法小結 37
3.2 K-Means算法 37
3.2.1 K-Means算法簡介 37
3.2.2 Mahout中K-Means算法實現(xiàn)原理 38
3.2.3 Mahout的K-Means算法實戰(zhàn) 39
3.2.4 K-Means算法小結 46
3.3 Mean Shift算法 46
3.3.1 Mean Shift算法簡介 46
3.3.2 Mahout中Mean Shift算法實現(xiàn)原理 46
3.3.3 Mahout的Mean Shift算法實戰(zhàn) 48
3.3.4 Mean Shift算法小結 51
3.4 本章小結 51
第4章 分類算法 52
4.1 Bayesian算法 53
4.1.1 Bayesian算法簡介 53
4.1.2 Mahout 中Bayesian算法實現(xiàn)原理 55
4.1.3 Mahout的Bayesian算法實戰(zhàn) 59
4.1.4 拓展 70
4.1.5 Bayesian算法小結 70
4.2 Random Forests算法 70
4.2.1 Random Forests算法簡介 70
4.2.2 Mahout中Random Forests算法實現(xiàn)原理 72
4.2.3 Mahout的Random Forests算法實戰(zhàn) 77
4.2.4 拓展 81
4.2.5 Random Forests算法小結 82
4.3 本章小結 83
第5章 協(xié)同過濾算法 84
5.1 Distributed Item-Based Collaborative Filtering算法 85
5.1.1 Distributed Item-Based Collaborative Filtering算法簡介 85
5.1.2 Mahout中Distributed ItemBased Collaborative Filtering算法實現(xiàn)原理 86
5.1.3 Mahout的Distributed Item Based Collaborative Filtering算法實戰(zhàn) 90
5.1.4 拓展 93
5.1.5 Distributed ItemBased Collabo-rative Filtering算法小結 94
5.2 Collaborative Filtering with ALSWR算法 94
5.2.1 Collaborative Filtering with ALSWR算法簡介 94
5.2.2 Mahout中Collaborative Filtering with ALS-WR算法實現(xiàn)原理 98
5.2.3 Mahout的Collaborative Filtering with ALS-WR算法實戰(zhàn) 99
5.2.4 拓展 107
5.2.5 Collaborative Filtering with ALSWR算法小結 107
5.3 本章小結 107
第6章 模式挖掘算法 108
6.1 FP樹關聯(lián)規(guī)則算法 109
6.1.1 FP樹關聯(lián)規(guī)則算法簡介 109
6.1.2 Mahout中Parallel Frequent Pattern Mining算法實現(xiàn)原理 113
6.1.3 Mahout的Parallel Frequent Pattern Mining算法實戰(zhàn) 120
6.1.4 拓展 125
6.2 本章小結 126
第7章 Mahout中的其他算法 127
7.1 Dimension Reduction算法 128
7.1.1 Dimension Reduction算法簡介 128
7.1.2 Mahout中Dimension Reduction算法實現(xiàn)原理 129
7.1.3 Mahout的Dimension Reduction算法實戰(zhàn) 133
7.1.4 拓展 139
7.2 本章小結 142
第三部分 實戰(zhàn)篇
第8章 Friend Find系統(tǒng) 144
8.1 系統(tǒng)功能 145
8.1.1 系統(tǒng)管理員 145
8.1.2 普通用戶 146
8.1.3 總體功能 146
8.2 數(shù)據(jù)庫設計 147
8.2.1 原始用戶數(shù)據(jù)表 148
8.2.2 注冊用戶數(shù)據(jù)表 149
8.2.3 系統(tǒng)管理員表 149
8.2.4 聚類中心表 149
8.3 系統(tǒng)技術框架 150
8.4 系統(tǒng)流程 152
8.4.1 登錄 152
8.4.2 注冊 153
8.4.3 上傳數(shù)據(jù) 154
8.4.4 調用K-Means算法 155
8.4.5 查看用戶分組 157
8.4.6 查看分組情況 158
8.4.7 查看分組成員 159
8.5 系統(tǒng)實現(xiàn) 159
8.5.1 登錄 159
8.5.2 注冊 161
8.5.3 上傳數(shù)據(jù) 162
8.5.4 調用K-Means算法 163
8.5.5 查看用戶分組 167
8.5.6 查看分組情況 167
8.5.7 查看分組成員 168
8.6 本章小結 170
第9章 Wine Identification系統(tǒng) 171
9.1 系統(tǒng)功能 172
9.1.1 用戶管理模塊 173
9.1.2 隨機森林模型建立模塊 173
9.1.3 隨機森林模型預測模塊 173
9.2 系統(tǒng)框架 173
9.3 數(shù)據(jù)庫設計 180
9.3.1 用戶表 180
9.3.2 系統(tǒng)常量表 181
9.4 系統(tǒng)流程 181
9.4.1 登錄 182
9.4.2 注銷 182
9.4.3 權限修改 182
9.4.4 密碼修改 183
9.4.5 用戶列表 183
9.4.6 數(shù)據(jù)上傳 184
9.4.7 隨機森林模型建立 185
9.4.8 隨機森林模型評估 186
9.4.9 隨機森林模型預測 187
9.5 系統(tǒng)實現(xiàn) 188
9.5.1 登錄 188
9.5.2 注銷 188
9.5.3 權限修改 189
9.5.4 密碼修改 190
9.5.5 用戶列表 191
9.5.6 數(shù)據(jù)上傳 193
9.5.7 隨機森林模型建立 194
9.5.8 隨機森林模型評估 194
9.5.9 隨機森林模型預測 195
9.6 本章小結 196
第10章 Dating Recommender系統(tǒng) 197
10.1 系統(tǒng)功能 198
10.1.1 系統(tǒng)管理員功能 198
10.1.2 普通用戶功能 199
10.1.3 功能總述 199
10.2 系統(tǒng)框架 200
10.3 數(shù)據(jù)庫設計 203
10.3.1 系統(tǒng)管理員表 203
10.3.2 原始用戶推薦信息表 204
10.3.3 基礎數(shù)據(jù)top10表 204
10.4 系統(tǒng)流程 204
10.4.1 登錄 205
10.4.2 上傳數(shù)據(jù) 205
10.4.3 推薦分析 206
10.4.4 單用戶推薦 210
10.4.5 新用戶推薦 211
10.5 算法設計 214
10.5.1 協(xié)同過濾算法接口設計 214
10.5.2 top10算法設計 215
10.5.3 新用戶推薦算法設計 221
10.6 系統(tǒng)實現(xiàn) 228
10.6.1 登錄 228
10.6.2 上傳數(shù)據(jù) 229
10.6.3 推薦分析 230
10.6.4 單用戶推薦 232
10.6.5 新用戶推薦 234
10.7 本章小結 235
第11章 博客推薦系統(tǒng) 237
11.1 系統(tǒng)功能 238
11.1.1 用戶管理 238
11.1.2 建立知識庫 239
11.1.3 博客管理 239
11.2 系統(tǒng)框架 240
11.3 數(shù)據(jù)庫設計 246
11.3.1 用戶信息表 246
11.3.2 知識庫信息表 247
11.3.3 系統(tǒng)常量表 248
11.4 系統(tǒng)流程 248
11.4.1 登錄 248
11.4.2 注冊 248
11.4.3 密碼修改 249
11.4.4 訂閱博客查看 249
11.4.5 博客訂閱與退訂 249
11.4.6 博客推薦 250
11.4.7 上傳數(shù)據(jù) 252
11.4.8 調用FP樹關聯(lián)規(guī)則算法 253
11.5 算法設計 260
11.6 系統(tǒng)實現(xiàn) 262
11.6.1 登錄 262
11.6.2 注冊 263
11.6.3 密碼修改 264
11.6.4 訂閱博客查看 265
11.6.5 運行FP云算法 266
11.6.6 博客訂閱與退訂 267
11.6.7 博客推薦 268
11.7 本章小結 270
Mahout算法解析與案例實戰(zhàn)內容簡介
全書11章共分為三個部分:第一部分為基礎篇(第1~2章),首先介紹了Mahout的應用背景、Mahout算法庫收錄的算法、Mahout的應用實例,以及開發(fā)環(huán)境的搭建;第二部分為算法篇(第3~7章),分析了Mahout算法庫中不同模塊的各個算法的原理以及Mahout實現(xiàn)流程,同時在各章節(jié)含有每個算法的實戰(zhàn),讓讀者可以自己運行程序,感受程序運行的各個流程;第三部分為實戰(zhàn)篇(第8~11章),通過對4個不同系統(tǒng)案例的分析講解,讓讀者了解開發(fā)完整的云平臺系統(tǒng)的各個流程,即需求分析、系統(tǒng)框架選擇及構建、系統(tǒng)功能設計和功能開發(fā)。
本書是一本經(jīng)典的Mahout著作,原理與實戰(zhàn)并重。不僅全面分析了Mahout算法庫不同模塊中的各個算法的原理及其實現(xiàn)流程,而且每個算法都輔之以實戰(zhàn)案例。此外,還包括4個系統(tǒng)級案例,實戰(zhàn)性非常強。
Mahout算法解析與案例實戰(zhàn)電子版內容截圖
- PC官方版
- 安卓官方手機版
- IOS官方手機版