有人評(píng)價(jià)這樣評(píng)價(jià)R語言與網(wǎng)站分析這本書,說它是一本內(nèi)容挺實(shí)在的書。在這本書的字里行間你都能看到作者的用心。本節(jié)內(nèi)容東坡小編為大家整理帶來的這份r語言與網(wǎng)站分析電子書為pdf格式高清版,以下有關(guān)于R語言與網(wǎng)站分析這本書的內(nèi)容及目錄簡(jiǎn)介,如果你想要查閱這本電子書的話,點(diǎn)擊本文相應(yīng)的下載地址進(jìn)行下載即可!
r語言與網(wǎng)站分析目錄
前言
第1章 統(tǒng)計(jì)思維與網(wǎng)站分析 1
1.1 不確定與確定 1
1.2 統(tǒng)計(jì)分析方法 4
1.2.1 細(xì)分分析 4
1.2.2 對(duì)比分析 6
1.2.3 趨勢(shì)分析 7
1.3 網(wǎng)站分析概要 7
1.3.1 解決用戶需求 7
1.3.2 尋找新的用戶需求 10
第2章 R語言數(shù)據(jù)操作基礎(chǔ) 11
2.1 R簡(jiǎn)介 11
2.2 了解R軟件 11
2.2.1 軟件安裝 11
2.2.2 R軟件界面 12
2.2.3 工作目錄 14
2.2.4 命令行交互 15
2.2.5 命令腳本文件 16
2.2.6 工作空間數(shù)據(jù) 16
2.2.7 幫助 17
2.2.8 R語言入門 18
2.2.9 擴(kuò)展算法包 19
2.3 R語言的數(shù)據(jù)類型 21
2.4 對(duì)象及其屬性 23
2.4.1 固有屬性:模式和長(zhǎng)度 24
2.4.2 讀取和設(shè)置屬性值 24
2.4.3 對(duì)象的搜索和刪除 25
2.5 向量 26
2.5.1 創(chuàng)建向量 26
2.5.2 向量索引 26
2.5.3 向量編輯 29
2.5.4 向量排序 29
2.5.5 向量去重 30
2.5.6 缺失值處理 30
2.5.7 向量間操作 31
2.6 矩陣和數(shù)組 31
2.6.1 創(chuàng)建矩陣 32
2.6.2 矩陣索引 33
2.6.3 矩陣編輯 34
2.6.4 矩陣的運(yùn)算 35
2.6.5 數(shù)組 37
2.6.6 apply函數(shù)應(yīng)用 38
2.7 列表和數(shù)據(jù)框 39
2.7.1 列表的創(chuàng)建和索引 39
2.7.2 列表編輯 40
2.7.3 數(shù)據(jù)框的創(chuàng)建和名稱 40
2.7.4 數(shù)據(jù)框索引 41
2.7.5 數(shù)據(jù)框編輯 43
2.7.6 缺失值處理 44
2.8 因子 44
2.8.1 無序和有序因子 45
2.8.2 連續(xù)數(shù)據(jù)的離散化 46
2.9 字符串操作 47
2.9.1 字符串長(zhǎng)度nchar 48
2.9.2 字符串合并和分割 48
2.9.3 字符串內(nèi)部字符的讀取和替換 49
2.9.4 正則表達(dá)式 52
2.10 常用數(shù)據(jù)的創(chuàng)建 53
2.10.1 因子序列的創(chuàng)建 53
2.10.2 等差序列的創(chuàng)建 54
2.10.3 隨機(jī)抽樣sample 54
2.10.4 重復(fù)序列rep 55
2.10.5 概率分布 55
2.11 控制流 58
2.11.1 分支語句 58
2.11.2 循環(huán)語句 59
2.12 運(yùn)算符、函數(shù)和過程 61
2.12.1 常用運(yùn)算符 61
2.12.2 函數(shù) 62
2.12.3 過程 63
2.13 數(shù)據(jù)的讀寫等操作 64
2.13.1 讀取數(shù)據(jù) 64
2.13.2 輸出數(shù)據(jù) 68
第3章 R語言的繪圖基礎(chǔ) 69
3.1 概述 69
3.2 顏色以及文字/點(diǎn)/線參數(shù)的設(shè)置 69
3.2.1 顏色 71
3.2.2 文字元素相關(guān)參數(shù)設(shè)置 76
3.2.3 點(diǎn)元素相關(guān)參數(shù)設(shè)置 77
3.2.4 線元素相關(guān)參數(shù)設(shè)置 79
3.3 低級(jí)繪圖函數(shù) 80
3.3.1 引例 80
3.3.2 標(biāo)題 81
3.3.3 圖例 83
3.3.4 坐標(biāo)軸 84
3.3.5 邊框 88
3.3.6 網(wǎng)格線 89
3.3.7 點(diǎn) 90
3.3.8 線 91
3.3.9 文字 94
3.3.10 多邊形 96
3.4 高級(jí)繪圖函數(shù)以及常用繪圖應(yīng)用 96
3.4.1 圖形類型的選擇 96
3.4.2 散點(diǎn)圖 98
3.4.3 氣泡圖 100
3.4.4 曲線圖 102
3.4.5 柱狀圖 105
3.4.6 條形圖 109
3.4.7 餅圖 111
3.4.8 面積堆積圖 115
3.4.9 直方圖和密度曲線圖 118
3.5 繪圖窗口操作函數(shù) 120
3.5.1 單一窗口中的子繪圖區(qū)域布局 120
3.5.2 繪圖窗口操作 120
第4章 單指標(biāo)分析 121
4.1 指標(biāo)描述 121
4.1.1 平均值和集中趨勢(shì) 121
4.1.2 正態(tài)分布 126
4.1.3 頻數(shù)分析 130
4.1.4 描述性分析指標(biāo) 131
4.2 異常點(diǎn)監(jiān)控 133
4.2.1 概述 133
4.2.2 P控制圖:監(jiān)控轉(zhuǎn)化率型指標(biāo) 135
4.2.3 單值–均值控制圖 142
4.2.4 單值–移動(dòng)極差控制圖 147
4.3 連續(xù)型指標(biāo)的對(duì)比 150
4.3.1 數(shù)據(jù)變換 150
4.3.2 假設(shè)檢驗(yàn) 152
4.3.3 相同指標(biāo)內(nèi)的兩組數(shù)對(duì)比:T檢驗(yàn) 153
4.3.4 相同指標(biāo)內(nèi)的多組數(shù)據(jù)對(duì)比:?jiǎn)我蛩胤讲罘治?156
4.3.5 單因素協(xié)方差分析 163
4.4 分類型指標(biāo)的對(duì)比 167
4.4.1 列聯(lián)表分析 167
4.4.2 卡方獨(dú)立性檢驗(yàn) 172
第5章 時(shí)間序列分析 177
5.1 時(shí)間序列 177
5.2 增長(zhǎng)率 180
5.2.1 環(huán)比增長(zhǎng)率 180
5.2.2 同比增長(zhǎng)率 181
5.3 移動(dòng)平均 181
5.3.1 數(shù)學(xué)原理概述 181
5.3.2 filter函數(shù) 182
5.3.3 R語言實(shí)現(xiàn) 184
5.4 指數(shù)平滑 185
5.4.1 一次指數(shù)平滑 186
5.4.2 二次指數(shù)平滑 187
5.4.3 三次指數(shù)平滑 191
5.5 ARIMA模型 194
5.5.1 自相關(guān)性 194
5.5.2 平穩(wěn)性和白噪聲 199
5.5.3 MA滑動(dòng)平均過程 200
5.5.4 AR自回歸過程 202
5.5.5 ARMA自回歸滑動(dòng)平均混合過程 203
5.5.6 檢驗(yàn)?zāi)P唾|(zhì)量 205
5.5.7 非平穩(wěn)時(shí)間序列的ARIMA過程 208
第6章 連續(xù)指標(biāo)建模:回歸分析 213
6.1 一元線性回歸分析 213
6.1.1 引例 213
6.1.2 一元線性回歸分析的原理及R語言實(shí)現(xiàn) 214
6.2 多元回歸分析 221
6.2.1 引例 222
6.2.2 多元線性回歸分析建模 222
6.2.3 模型修正函數(shù)update() 223
6.2.4 逐步回歸分析函數(shù)step() 226
6.2.5 自變量中包含分類型數(shù)據(jù)的回歸分析 228
6.3 Logic回歸分析 230
6.3.1 引例及數(shù)據(jù) 230
6.3.2 logic分析的原理 230
6.3.3 R語言實(shí)現(xiàn) 232
6.4 回歸樹CART 237
6.4.1 rpart函數(shù) 237
6.4.2 預(yù)測(cè)及模型性能衡量 240
6.4.3 過度擬合和剪枝 240
第7章 分類指標(biāo)建模:分類分析 243
7.1 決策樹分類分析 243
7.1.1 概述 243
7.1.2 C4.5算法 247
7.1.3 CART算法 258
7.1.4 條件推理決策樹算法 265
7.1.5 隨機(jī)森林算法 267
7.2 貝葉斯分類 268
7.2.1 貝葉斯定理 268
7.2.2 樸素貝葉斯分類器 270
7.3 支持向量機(jī)SVM 271
7.3.1 原理 271
7.3.2 在R語言中實(shí)現(xiàn)非線性SVM分析 273
7.4 人工神經(jīng)網(wǎng)絡(luò) 274
7.4.1 神經(jīng)元 274
7.4.2 兩層網(wǎng)絡(luò) 275
7.4.3 反向傳播算法 276
7.4.4 R語言實(shí)現(xiàn) 282
7.4.5 隱藏層中神經(jīng)單元數(shù)目的確定 283
7.5 分類器的性能評(píng)估 284
7.5.1 混淆矩陣 284
7.5.2 ROC曲線和AUC 287
7.5.3 提升度和提升曲線 291
7.5.4 洛倫茲曲線 292
第8章 樣本細(xì)分 293
8.1 數(shù)據(jù)降維 293
8.1.1 問題引入 293
8.1.2 因子分析概述 294
8.1.3 factanal函數(shù) 296
8.1.4 實(shí)例:?jiǎn)柧碚{(diào)查的因子分析 297
8.2 聚類分析 303
8.2.1 距離 303
8.2.2 層次聚類 313
8.2.3 kmeans聚類 318
8.3 樣本判別 321
8.3.1 knn(k最近鄰分類)算法 323
8.3.2 實(shí)例:基于knn算法的商品推薦系統(tǒng) 324
第9章 樣本間的關(guān)系 329
9.1 關(guān)聯(lián)分析 329
9.1.1 關(guān)聯(lián)分析的原理 329
9.1.2 Apriori算法的R語言實(shí)現(xiàn) 331
9.2 序列模式關(guān)聯(lián)分析 334
9.2.1 序列模式關(guān)聯(lián)分析的原理 334
9.2.2 序列模式關(guān)聯(lián)分析的R語言實(shí)現(xiàn) 336
9.2.3 實(shí)例:用戶點(diǎn)擊頁面的行為分析 338
9.3 關(guān)系網(wǎng)絡(luò)分析 346
9.3.1 網(wǎng)絡(luò)關(guān)系分析的基本概念 346
9.3.2 中心度 356
9.3.3 中心勢(shì) 362
9.3.4 社群發(fā)現(xiàn) 363
9.3.5 實(shí)例:分析微博的傳播特性 367
9.3.6 實(shí)例:購(gòu)物車商品分類分析 370
第10章 文本分析 378
10.1 數(shù)據(jù)處理 378
10.1.1 數(shù)據(jù)引例 378
10.1.2 分詞和詞條 380
10.1.3 語料庫和文檔 381
10.1.4 詞條—文檔關(guān)系矩陣 384
10.2 實(shí)例:QQ群消息歷史分析 387
10.2.1 數(shù)據(jù)集 387
10.2.2 數(shù)據(jù)集格式轉(zhuǎn)化 389
10.2.3 留言文本的分詞操作 390
10.2.4 分析常用話題詞匯 391
10.2.5 建立用戶–詞條間的網(wǎng)絡(luò)關(guān)系圖 392
10.2.6 繪制重點(diǎn)詞條和用戶的網(wǎng)絡(luò)圖 392
10.3 XML包爬取網(wǎng)頁數(shù)據(jù) 394
10.3.1 htmlParse函數(shù) 395
10.3.2 getNodeSet函數(shù) 395
10.3.3 xmlValue函數(shù) 396
10.3.4 xmlGetAttr函數(shù) 396
10.3.5 實(shí)例:爬取某電商網(wǎng)站襯衫類目商品的部分信息 397
第11章 網(wǎng)站指標(biāo)監(jiān)控系統(tǒng)的搭建 400
11.1 gWidgets包基礎(chǔ) 400
11.1.1 環(huán)境搭建 400
11.1.2 引例 401
11.1.3 常用控件 406
11.2 實(shí)例:商品搜索算法參數(shù)配置監(jiān)控GUI系統(tǒng) 414
11.2.1 商品搜索算法概述 414
11.2.2 原始商品信息 415
11.2.3 系統(tǒng)概述 417
11.2.4 模塊布局 418
11.2.5 計(jì)算除關(guān)鍵字匹配以外的指標(biāo)得分 420
11.2.6 模擬一次搜索行為數(shù)據(jù) 421
11.2.7 模擬多次搜索行為數(shù)據(jù) 423
11.2.8 繪圖 423
第12章 基于RFM模型的客戶價(jià)值系統(tǒng) 427
12.1 馬爾科夫鏈 427
12.1.1 引例 427
12.1.2 概念 428
12.1.3 預(yù)測(cè)實(shí)例 428
12.2 RFM模型 431
12.2.1 RFM的概念 431
12.2.2 數(shù)據(jù)集 431
12.2.3 購(gòu)買行為隨機(jī)模型 432
12.3 結(jié)合馬爾科夫鏈的RFM模型 436
12.3.1 購(gòu)買狀態(tài)轉(zhuǎn)移矩陣 437
12.3.2 預(yù)測(cè)用戶購(gòu)買狀態(tài) 445
r語言與網(wǎng)站分析簡(jiǎn)介
該書是目前為止國(guó)內(nèi)唯一一本闡述如何使用R語言來分析和挖掘互聯(lián)網(wǎng)數(shù)據(jù)的應(yīng)用性書籍。書中使用大量的實(shí)際案例,把數(shù)學(xué)原理同R語言實(shí)現(xiàn)方案有機(jī)結(jié)合起來。力圖通過案例分析達(dá)到舉一反三的效果,進(jìn)而指導(dǎo)讀者在日后的實(shí)際工作中進(jìn)行應(yīng)用。同時(shí)書中也闡述眾多常用的數(shù)據(jù)分析和挖掘的方法和原理,對(duì)于非互聯(lián)網(wǎng)的從業(yè)人員也很有指導(dǎo)意義
該書從互聯(lián)網(wǎng)應(yīng)用角度對(duì)R語言如何實(shí)現(xiàn)數(shù)據(jù)挖掘和指標(biāo)分析等問題做了闡述。通過諸多真實(shí)應(yīng)用案例的分析,作者試圖為讀者建立起一座溝通數(shù)學(xué)原理和互聯(lián)網(wǎng)實(shí)際業(yè)務(wù)應(yīng)用的橋梁。同時(shí)本書給出了案例中的完整代碼以及分析過程,力圖幫助讀者充分理解R語言是如何實(shí)現(xiàn)算法的。
r語言與網(wǎng)站分析電子書內(nèi)容截圖
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版