R語言醫(yī)學(xué)數(shù)據(jù)分析實(shí)戰(zhàn)(異步圖書出品)
定 價:79 元
- 作者:趙軍 著
- 出版時間:2020/8/1
- ISBN:9787115539151
- 出 版 社:人民郵電出版社
- 中圖法分類:R195.1-39
- 頁碼:278
- 紙張:
- 版次:01
- 開本:16開
本書以醫(yī)學(xué)數(shù)據(jù)為例,講解如何使用R進(jìn)行數(shù)據(jù)分析,結(jié)合大量精選的實(shí)例對常用分析方法進(jìn)行了深入淺出的介紹,以幫助讀者解決醫(yī)學(xué)數(shù)據(jù)分析中的實(shí)際問題。
本書共分為14章,第1章~第3章介紹了R語言的基本用法;第4章介紹了數(shù)據(jù)可視化;第5章介紹了基本的統(tǒng)計分析方法;第6章~第8章介紹了醫(yī)學(xué)研究中最常用的三種回歸模型;第9章介紹了生存分析的基本方法;第10章~第12章介紹了幾種常用的多元統(tǒng)計分析方法;第13章介紹了臨床診斷試驗(yàn)的統(tǒng)計評價指標(biāo)和計算方法;第14章介紹了在醫(yī)學(xué)科研實(shí)踐中常用的Meta分析方法。
本書適用于臨床醫(yī)學(xué)、公共衛(wèi)生及其他醫(yī)學(xué)相關(guān)專業(yè)的本科生和研究生使用,亦可作為其他專業(yè)的學(xué)生和科研工作者學(xué)習(xí)數(shù)據(jù)分析的參考書。閱讀本書,讀者不僅能掌握使用R及相關(guān)包快速解決實(shí)際問題的方法,還能更深入地理解數(shù)據(jù)分析。
1.本書的作者具有很好的數(shù)學(xué)基礎(chǔ),長期在醫(yī)學(xué)院校講授醫(yī)學(xué)統(tǒng)計學(xué),具有豐富的教學(xué)經(jīng)驗(yàn);
2.在介紹統(tǒng)計方法時,本書沒有拘泥于煩瑣的細(xì)節(jié),讓讀者很容易看到問題的本質(zhì)和整體結(jié)構(gòu),并很快獲取重要信息。
3.書中配有大量的案例解析和程序示例,每一章都配有練習(xí)題,書末附有習(xí)題的參考答案。這樣安排,既方便教師的教學(xué)和學(xué)生的學(xué)習(xí),也方便了初學(xué)者檢驗(yàn)自己的學(xué)習(xí)成果。
4.書中示例和習(xí)題解答的源程序可以從異步社區(qū)下載,同時配套提供彩圖。函數(shù)名的索引附在書后以方便讀者速查。
趙軍,泰國宋卡王子大學(xué)流行病學(xué)博士,湖北醫(yī)藥學(xué)院公共衛(wèi)生與管理學(xué)院副教授、碩士研究生導(dǎo)師。講授醫(yī)藥數(shù)理統(tǒng)計方法、醫(yī)學(xué)統(tǒng)計學(xué)、高級統(tǒng)計學(xué)等課程。近三年以第一作者身份發(fā)表SCI論文5篇,研究方向?yàn)榕R床流行病學(xué)、醫(yī)學(xué)統(tǒng)計學(xué)。
第 1章 R語言介紹\t1
1.1 什么是R語言 1
1.2 為什么使用R分析數(shù)據(jù) 1
1.3 R的下載與安裝 2
1.4 啟動和退出R 2
1.5 RStudio 3
1.6 R包 4
1.6.1 什么是包 4
1.6.2 包的安裝 5
1.6.3 包的使用和更新 5
1.7 開始使用R 5
1.7.1 獲取幫助 5
1.7.2 把R當(dāng)作一個計算器 6
1.7.3 R對象 8
1.8 工作空間管理 11
1.9 小結(jié) 12
1.10 習(xí)題 12
第 2章 創(chuàng)建數(shù)據(jù)集 14
2.1 R的數(shù)據(jù)結(jié)構(gòu) 14
2.1.1 向量 14
2.1.2 因子 16
2.1.3 矩陣 17
2.1.4 數(shù)組 19
2.1.5 列表 20
2.1.6 數(shù)據(jù)框 21
2.1.7 數(shù)據(jù)類型的轉(zhuǎn)換 22
2.2 用R獲取數(shù)據(jù) 23
2.2.1 獲取內(nèi)置數(shù)據(jù)集 23
2.2.2 模擬特定分布的數(shù)據(jù) 24
2.2.3 獲取其他格式的數(shù)據(jù) 25
2.2.4 導(dǎo)出數(shù)據(jù) 26
2.2.5 用rio包導(dǎo)入和導(dǎo)出數(shù)據(jù) 26
2.3 數(shù)據(jù)錄入 27
2.4 小結(jié) 28
2.5 習(xí)題 30
第3章 數(shù)據(jù)框的操作 31
3.1 用基本包處理數(shù)據(jù)框 31
3.1.1 查看數(shù)據(jù)框里的內(nèi)容 31
3.1.2 選取數(shù)據(jù)框的子集 34
3.1.3 將數(shù)據(jù)框按照某個變量的值排序 35
3.1.4 查找和刪除重復(fù)數(shù)據(jù) 36
3.1.5 在數(shù)據(jù)框中添加和刪除變量 37
3.1.6 把數(shù)據(jù)框添加到搜索路徑 38
3.2 用dplyr包處理數(shù)據(jù)框 39
3.2.1 使用filter()和slice()篩選行 40
3.2.2 使用arrange()排列行 41
3.2.3 使用select()選擇列 42
3.2.4 使用mutate()添加新變量 43
3.2.5 使用summarise()計算統(tǒng)計量 43
3.2.6 使用group_by()拆分?jǐn)?shù)據(jù)框 44
3.2.7 使用傳遞符“%>%”組合多個操作 45
3.3 數(shù)據(jù)框的合并 46
3.3.1 縱向合并 46
3.3.2 橫向合并 47
3.3.3 按照某個共有變量合并 47
3.4 數(shù)據(jù)框的長寬格式的轉(zhuǎn)換 48
3.5 缺失值的處理 50
3.5.1 識別缺失值 50
3.5.2 探索數(shù)據(jù)框里的缺失值 51
3.5.3 填充缺失值 52
3.6 處理大型數(shù)據(jù)集的策略 55
3.6.1 清理工作空間 55
3.6.2 快速讀。甤sv文件 55
3.6.3 模擬一個大型數(shù)據(jù)集 56
3.6.4 剔除不需要的變量 57
3.6.5 選取數(shù)據(jù)集的一個隨機(jī)樣本 58
3.7 小結(jié) 58
3.8 習(xí)題 60
第4章 數(shù)據(jù)可視化 62
4.1 用R的基礎(chǔ)繪圖系統(tǒng)作圖 62
4.1.1 函數(shù)plot() 62
4.1.2 直方圖和密度曲線圖 63
4.1.3 條形圖 65
4.1.4 餅圖 67
4.1.5 箱線圖和小提琴圖 67
4.1.6 克利夫蘭點(diǎn)圖 68
4.1.7 導(dǎo)出圖形 69
4.2 用ggplot2包作圖 70
4.2.1 初識ggplot2包 70
4.2.2 分布的特征 74
4.2.3 比例的構(gòu)成 76
4.2.4 用函數(shù)ggsave()保存圖形 78
4.3 其他圖形 78
4.3.1 金字塔圖 78
4.3.2 橫向堆棧條形圖 79
4.3.3 熱圖 79
4.3.4 三維散點(diǎn)圖 80
4.3.5 詞云圖 81
4.3.6 動態(tài)圖形 82
4.4 小結(jié) 83
4.5 習(xí)題 85
第5章 基本統(tǒng)計分析 86
5.1 數(shù)值型變量的描述性統(tǒng)計分析 88
5.2 分類變量的列聯(lián)表和獨(dú)立性檢驗(yàn) 91
5.2.1 生成頻數(shù)表和列聯(lián)表 91
5.2.2 獨(dú)立性檢驗(yàn) 96
5.3 連續(xù)型變量組間差異的比較 101
5.3.1 獨(dú)立樣本的t檢驗(yàn) 101
5.3.2 非獨(dú)立樣本的t檢驗(yàn) 102
5.3.3 單因素方差分析 103
5.3.4 組間差異的非參數(shù)檢驗(yàn) 105
5.4 用函數(shù)tablestack()匯總雙變量分析結(jié)果 106
5.5 變量間的相關(guān)性 111
5.5.1 連續(xù)型變量間的相關(guān)性 111
5.5.2 分類變量間的相關(guān)性 114
5.5.3 相關(guān)性的可視化 115
5.6 小結(jié) 118
5.7 習(xí)題 120
第6章 線性回歸分析 122
6.1 簡單線性回歸 122
6.1.1 擬合簡單線性回歸模型 123
6.1.2 模型輸出結(jié)果的解釋 124
6.1.3 回歸診斷 126
6.2 分層線性回歸 129
6.3 多重線性回歸 133
6.3.1 擬合多重線性回歸模型 133
6.3.2 多重共線性 135
6.3.3 逐步回歸 136
6.3.4 回歸診斷 139
6.4 小結(jié) 140
6.5 習(xí)題 141
第7章 Logistic回歸分析 142
7.1 二分類Logistic回歸 142
7.1.1 Logistic回歸模型 142
7.1.2 Logistic回歸實(shí)例 143
7.1.3 表格數(shù)據(jù)的Logistic回歸 151
7.2 條件Logistic回歸 155
7.3 無序多分類Logistic回歸 157
7.4 有序Logistic回歸 161
7.5 小結(jié) 166
7.6 習(xí)題 167
第8章 Poisson回歸分析 168
8.1 Poisson回歸模型 168
8.2 過度離散的判定及處理 171
8.3 對數(shù)線性模型 174
8.4 小結(jié) 178
8.5 習(xí)題 178
第9章 生存分析 180
9.1 生存對象 180
9.2 生存率的估計與生存曲線 182
9.3 生存率的比較 184
9.4 Cox回歸 186
9.4.1 建立Cox回歸模型 186
9.4.2 比例風(fēng)險假定的檢驗(yàn) 188
9.4.3 生存的預(yù)測 188
9.5 小結(jié) 190
9.6 習(xí)題 190
第 10章 聚類分析 192
10.1 相似性的度量 192
10.1.1 樣品間的距離 192
10.1.2 變量間的相似系數(shù) 195
10.2 層次聚類法 196
10.2.1 類之間相似系數(shù)的定義 196
10.2.2 Q型聚類 196
10.2.3 R型聚類 203
10.3 k均值聚類法 204
10.4 小結(jié) 206
10.5 習(xí)題 207
第 11章 判別分析 209
11.1 距離判別 209
11.2 K最鄰近判別 213
11.3 Fisher判別 215
11.4 Bayes判別 218
11.5 小結(jié) 219
11.6 習(xí)題 220
第 12章 主成分分析和因子分析 221
12.1 主成分分析 221
12.1.1 主成分的定義 221
12.1.2 主成分的求解 222
12.1.3 主成分分析的注意事項(xiàng) 226
12.2 因子分析 226
12.2.1 因子分析模型的定義 226
12.2.2 因子分析模型的求解 227
12.2.3 因子旋轉(zhuǎn) 229
12.2.4 因子分析的注意事項(xiàng) 231
12.3 小結(jié) 232
12.4 習(xí)題 233
第 13章 臨床診斷試驗(yàn)評價 234
13.1 二分類結(jié)果的評價指標(biāo) 234
13.1.1 靈敏度和特異度 234
13.1.2 預(yù)測值 235
13.1.3 圖解靈敏度、特異度、陽性預(yù)測值和陰性預(yù)測值 235
13.1.4 診斷試驗(yàn)的綜合評價指標(biāo) 236
13.2 ROC及曲線下面積 237
13.2.1 單個ROC分析 237
13.2.2 兩個ROC的比較 240
13.2.3 Logistic回歸的ROC曲線 241
13.3 聯(lián)合試驗(yàn) 243
13.4 小結(jié) 244
13.5 習(xí)題 244
第 14章 Meta分析 245
14.1 Meta分析的基本步驟 245
14.2 Meta分析的常用統(tǒng)計方法 246
14.3 二分類變量資料的Meta分析 247
14.3.1 OR、RR或RD的合并 248
14.3.2 發(fā)表偏倚的識別 251
14.3.3 敏感性分析 253
14.4 連續(xù)型變量資料的Meta分析 254
14.5 Meta分析的注意事項(xiàng) 255
14.6 小結(jié) 256
14.7 習(xí)題 256
習(xí)題參考答案 258
參考文獻(xiàn) 273
函數(shù)索引 274