本書以R語言為實現(xiàn)工具,以數(shù)據(jù)可視化分析為導向,結(jié)合實際案例介紹數(shù)據(jù)可視化方法。全書共8章,第1章介紹數(shù)據(jù)可視化概述以及R語言數(shù)據(jù)處理的基本技能;第2章介紹R語言繪圖基礎,重點介紹R語言傳統(tǒng)繪圖包graphics中的繪圖函數(shù)及基本使用方法;第3章介紹類別數(shù)據(jù)的可視化方法;第4章介紹數(shù)據(jù)分布特征的可視化方法;第5章介紹變量間關系的可視化方法;第6章介紹樣本相似性的可視化方法;第7章介紹時間序列的可視化方法;第8章介紹幾種特殊的可視化圖形以及出版物中圖表的使用技巧。附錄列出了本書使用的R包和R函數(shù)。
本書可作為高等院校各專業(yè)“數(shù)據(jù)可視化”相關課程的教材,也可作為數(shù)據(jù)分析工作者、R語言和可視化分析的愛好者的參考書。
首先,本書的寫作角度立足于數(shù)據(jù)可視化本身,而不是R實現(xiàn)。從數(shù)據(jù)類型出發(fā),介紹可能的可視化圖形,并使用實際數(shù)據(jù)進行展示。
其次,本書盡可能體現(xiàn)R可視化的多樣性和靈活性,同一種圖形盡量使用不同的R函數(shù)實現(xiàn),有利于讀者對R的理解和應用。
最后,本書每章圖形都附有R的實現(xiàn)代碼,書后列有詳細的函數(shù)清單,方便讀者查閱。
賈俊平 中國人民大學統(tǒng)計學院副教授。研究方向:統(tǒng)計方法在經(jīng)濟各領域的應用、統(tǒng)計教學方式和方法。主要著作有:《統(tǒng)計學》、《描述統(tǒng)計》、《工商管理統(tǒng)計》、《市場調(diào)查與分析》等。主持研究的“非統(tǒng)計學專業(yè)本科公共基礎課——統(tǒng)計學教學改革”項目獲2001年國家級教學成果二等獎、2001年北京市教學成果一等獎。2001年榮獲北京市經(jīng)濟技術創(chuàng)新標兵稱號,2003年榮獲寶鋼優(yōu)秀教師獎等。
第 1章 數(shù)據(jù)可視化與R語言
1.1 數(shù)據(jù)可視化概述 001
1.1.1 數(shù)據(jù)可視化及其分類 001
1.1.2 數(shù)據(jù)可視化的數(shù)據(jù)類型 002
1.1.3 數(shù)據(jù)可視化的實現(xiàn)工具 003
1.1.4 數(shù)據(jù)可視化注意事項 003
1.2 R軟件的初步使用 003
1.2.1。臆浖南螺d與安裝 004
1.2.2 對象賦值與運行 004
1.2.3 編寫代碼腳本 005
1.2.4 查看幫助文件 005
1.2.5 包的安裝與加載 006
1.3 創(chuàng)建R格式數(shù)據(jù) 006
1.3.1 向量、矩陣和數(shù)組 007
1.3.2 數(shù)據(jù)框 009
1.3.3 因子和列表 013
1.4 R語言數(shù)據(jù)處理 014
1.4.1 數(shù)據(jù)讀取和保存 014
1.4.2 隨機數(shù)和數(shù)據(jù)抽樣 015
1.4.3 生成頻數(shù)分布表 015
1.4.4 數(shù)據(jù)類型的轉(zhuǎn)換 022
習題 026
第 2章 R語言繪圖基礎
2.1 R語言的基本繪圖函數(shù) 027
2.1.1 高級繪圖函數(shù) 027
2.1.2 低級繪圖函數(shù) 030
2.2 圖形參數(shù)與圖形控制 032
2.2.1 繪圖參數(shù) 032
2.2.2 圖形控制 034
2.2.3 圖形顏色 037
2.3 頁面布局與圖形組合 041
2.3.1 用par函數(shù)布局頁面 041
2.3.2 用layout函數(shù)布局頁面 042
2.3.3 同時打開多個繪圖窗口 044
習題 045
第3章 類別數(shù)據(jù)可視化
3.1 條形圖及其變種 046
3.1.1 簡單條形圖和帕累托圖 046
3.1.2 并列條形圖和堆疊條形圖 049
3.1.3 不等寬條形圖和脊形圖 053
3.2 樹狀圖 056
3.2.1 條形樹狀圖 056
3.2.2 矩形樹狀圖 058
3.3 馬賽克圖及其變種 059
3.3.1 馬賽克圖 059
3.3.2 馬賽克圖的變種 061
3.4 關聯(lián)圖和獨立性檢驗的P值圖 064
3.4.1 關聯(lián)圖 064
3.4.2 獨立性檢驗的P值圖 066
3.5 氣球圖和熱圖 067
3.5.1 氣球圖 067
3.5.2 熱圖 070
3.6 南丁格爾玫瑰圖 072
3.7 金字塔圖 075
3.8 餅圖及其變種 077
3.8.1 餅圖和扇形圖 077
3.8.2 環(huán)形圖 079
習題 081
第4章 分布特征可視化
4.1 直方圖與核密度圖 082
4.1.1 直方圖 082
4.1.2 核密度圖 089
4.2 箱線圖和小提琴圖 096
4.2.1 箱線圖 097
4.2.2 小提琴圖 102
4.3 點圖、帶狀圖和太陽花圖 105
4.3.1 點圖 105
4.3.2 帶狀圖和太陽花圖 107
4.4 海盜圖 109
4.5 分布概要圖 111
4.6 正態(tài)概率圖 112
習題 115
第5章 變量間關系可視化
5.1 散點圖與散點圖矩陣 116
5.1.1 散點圖 116
5.1.2 散點圖矩陣 121
5.1.3 相關系數(shù)矩陣 123
5.1.4 相關系數(shù)網(wǎng)狀圖 128
5.2 條件散點圖 129
5.3 大數(shù)據(jù)集的散點圖 134
5.4 3D散點圖和氣泡圖 136
5.4.1 3D散點圖 136
5.4.2 氣泡圖 138
5.5 廣義配對圖 140
習題 142
第6章 樣本相似性可視化
6.1 輪廓圖和雷達圖 144
6.1.1 輪廓圖 144
6.1.2 雷達圖 148
6.2 星圖和臉譜圖 151
6.2.1 星圖 151
6.2.2 臉譜圖 154
6.3 聚類圖和熱圖 156
6.3.1 聚類圖 156
6.3.2 熱圖 160
習題 167
第7章 時間序列可視化
7.1 變化模式可視化 168
7.1.1 折線圖與面積圖 168
7.1.2 蒸汽圖與風箏圖 174
7.1.3 表格圖 177
7.1.4 日歷圖 179
7.2 變動特征可視化 181
7.2.1 時間序列的瀑布圖 181
7.2.2 兩個時點間的斜率圖 183
7.2.3 序列的改變點 185
7.2.4 時間序列的動態(tài)交互圖 187
7.3 序列成分可視化 188
7.3.1 成分分解 189
7.3.2 隨機成分平滑 193
習題 194
第8章 其他可視化圖形
8.1 瀑布圖 196
8.2 和弦圖 198
8.3 桑基圖 200
8.4 平行集圖 202
8.5 3D透視圖 203
8.6 詞云圖 205
8.7 出版物中的圖表 209
8.7.1 繪制表格 209
8.7.2 繪制帶有表格和注釋文本的圖形 211
8.7.3 繪制帶有檢驗信息的圖形 214
8.8 為圖形添加背景圖片 215
習題 216
附錄 本書使用的R包和R函數(shù) 217
參考文獻 224