數(shù)據(jù)可視化——從小白到數(shù)據(jù)工程師的成長之路
定 價(jià):52 元
- 作者:劉英華
- 出版時(shí)間:2019/11/1
- ISBN:9787121362231
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:252
- 紙張:
- 版次:01
- 開本:16開
掌握數(shù)據(jù)可視化技術(shù)是未來工作和學(xué)習(xí)的必備能力,是展示理念和成果的重要手段。閱讀并完成本書的實(shí)踐,你將快速地學(xué)會數(shù)據(jù)獲取、清洗、分析、可視化及發(fā)布的完整流程。本書以豐富的實(shí)踐案例解析數(shù)據(jù)可視化的制作理念和具體方法,緊密圍繞當(dāng)前數(shù)據(jù)可視化領(lǐng)域的實(shí)際需求,全面介紹數(shù)據(jù)可視化的概念和技巧。本書包含基礎(chǔ)知識、數(shù)據(jù)獲取、數(shù)據(jù)清洗、數(shù)據(jù)分析、可視化基礎(chǔ)和原則、數(shù)據(jù)可視化工具和可視化作品發(fā)布等內(nèi)容,基于具體案例多角度啟發(fā)和引導(dǎo)讀者的創(chuàng)新思維,增強(qiáng)讀者對抽象數(shù)據(jù)的把握及綜合可視化能力的提升。本書內(nèi)容通俗易懂,簡明實(shí)用,配套的教學(xué)輔助資料可免費(fèi)下載。本書適合零編程基礎(chǔ)的數(shù)據(jù)可視化從業(yè)者和高校師生閱讀,有一定工作經(jīng)驗(yàn)的數(shù)據(jù)可視化工程師也可以從本書中學(xué)到大量實(shí)用的技能。
劉英華,中國社會科學(xué)院大學(xué)副教授,國家自然基金《基于大規(guī)模復(fù)雜結(jié)構(gòu)知識庫的知識發(fā)現(xiàn)機(jī)理、模型與算法研究》、國家自然基金《基于多關(guān)系的模糊認(rèn)知圖挖掘模型、算法與評價(jià)機(jī)制研究》項(xiàng)目的主要參與人員。
目 錄
第1章 基礎(chǔ)知識 1
1.1 模擬和數(shù)字化 1
1.2 數(shù)模轉(zhuǎn)換 1
1.3 進(jìn)制 2
1.4 存儲單位 3
1.5 因特網(wǎng) 3
1.6 地址和協(xié)議 4
1.7 域名和域名系統(tǒng) 6
1.8 網(wǎng)絡(luò)速率 6
1.9 數(shù)據(jù)可視化 7
小結(jié) 7
習(xí)題1 7
第2章 數(shù)據(jù)獲取 8
2.1 知識共享許可協(xié)議 8
2.2 搜索數(shù)據(jù) 9
2.2.1 搜索引擎 10
2.2.2 瀏覽器 11
2.2.3 搜索指令 11
2.3 主動公開的數(shù)據(jù) 15
2.3.1 我國政府?dāng)?shù)據(jù) 15
2.3.2 國際組織數(shù)據(jù) 17
2.3.3 科研機(jī)構(gòu)及第三方數(shù)據(jù)公司 17
2.4 依申請公開數(shù)據(jù) 17
2.5 數(shù)據(jù)眾包 18
2.6 抓取工具 18
2.6.1 import.io工具 20
2.6.2 Octoparse工具 23
2.7 Python基礎(chǔ) 33
2.7.1 環(huán)境配置 33
2.7.2 第一個Python程序 35
2.7.3 變量和運(yùn)算符 36
2.7.4 條件語句 43
2.7.5 循環(huán)語句 45
2.7.6 輸入和輸出 48
2.7.7 文件的讀/寫 49
2.8 Beautiful Soup庫 51
2.8.1 安裝Beautiful Soup 51
2.8.2 使用Beautiful Soup抓取網(wǎng)頁數(shù)據(jù) 52
2.9 圖片的獲取 56
2.9.1 常用的圖片編輯軟件 56
2.9.2 圖片文件類型 57
2.9.3 圖片文件的保存 58
2.10 音頻的獲取 59
2.10.1 常用的音頻編輯軟件 60
2.10.2 音頻文件類型及保存 61
2.11 視頻的獲取 62
2.11.1 常用的視頻編輯軟件 62
2.11.2 視頻文件類型 63
2.11.3 視頻文件的保存 63
2.12 數(shù)據(jù)格式轉(zhuǎn)換 64
2.12.1 數(shù)字圖片的格式轉(zhuǎn)換 65
2.12.2 數(shù)字音頻的格式轉(zhuǎn)換 67
2.12.3 數(shù)字視頻的格式轉(zhuǎn)換 68
2.12.4 文件格式轉(zhuǎn)換 68
2.12.5 可機(jī)讀數(shù)據(jù) 70
小結(jié) 70
習(xí)題2 70
第3章 數(shù)據(jù)清洗 71
3.1 Jupyter Notebook 71
3.1.1 安裝Jupyter Notebook 72
3.1.2 啟動、關(guān)閉notebook服務(wù)器 72
3.1.3 保存notebook 75
3.2 Pandas包 75
3.2.1 系列(Series) 75
3.2.2 數(shù)據(jù)幀(DataFrame) 78
3.3 清洗缺失值 80
3.3.1 檢查缺失值 80
3.3.2 刪除含缺失值的行或列 82
3.3.3 填充缺失值 82
3.4 清洗格式內(nèi)容 84
3.4.1 刪除字符串中的空格 84
3.4.2 大小寫轉(zhuǎn)換 85
3.4.3 規(guī)范數(shù)據(jù)格式 87
3.4.4 字符型數(shù)據(jù)判斷 87
?
3.5 清洗邏輯錯誤 88
3.5.1 刪除重復(fù)記錄 88
3.5.2 替換不合理值 89
3.6 刪除非需求數(shù)據(jù) 90
3.6.1 刪除非需求行 90
3.6.2 刪除非需求列 90
3.7 分組、合并和保存 91
3.7.1 分組 91
3.7.2 數(shù)據(jù)合并 92
3.7.3 保存結(jié)果 96
3.8 數(shù)據(jù)清洗案例 97
3.8.1 案例1 97
3.8.2 案例2 102
小結(jié) 104
習(xí)題3 104
第4章 數(shù)據(jù)分析 105
4.1 數(shù)據(jù)定位 105
4.1.1 了解基本數(shù)據(jù) 105
4.1.2 使用[ ]定位 107
4.1.3 使用loc[ ]定位 108
4.1.4 使用iloc[ ]定位 110
4.1.5 使用iat[ ]定位 112
4.2 條件篩選和排序數(shù)據(jù) 113
4.2.1 條件篩選 113
4.2.2 排序和排名 117
4.3 數(shù)據(jù)的描述性分析 121
4.3.1 describe( )方法 121
4.3.2 眾數(shù)、均值和中位數(shù) 123
4.3.3 數(shù)據(jù)重塑 124
4.3.4 相關(guān)性計(jì)算 131
小結(jié) 132
習(xí)題4 132
第5章 可視化基礎(chǔ)和原則 133
5.1 圖表 135
5.1.1 圖表的種類 135
5.1.2 圖表設(shè)計(jì)原則 142
5.2 色彩暗示 152
5.2.1 色調(diào) 152
5.2.2 明度 153
5.2.3 飽和度 154
5.2.4 色彩暗示的綜合運(yùn)用 155
5.3 圖表可視化原則 156
5.3.1 “第一眼”原則 156
5.3.2 數(shù)據(jù)不是敵人 157
5.3.3 刪減無關(guān)的元素 157
5.3.4 慎用3D圖表 159
5.3.5 視覺暗示的使用 160
5.3.6 整體變個體 161
5.3.7 交互圖表原則 162
5.3.8 顯示上下文 164
5.4 圖表可視化的失敗案例 165
5.5 設(shè)計(jì)排版原則 168
5.5.1 順序 168
5.5.2 標(biāo)注 171
5.5.3 動畫效果 171
5.5.4 分組 173
5.5.5 賦形 173
小結(jié) 174
習(xí)題5 175
第6章 數(shù)據(jù)可視化工具 176
6.1 信息圖制作工具 176
6.2 可視化工具Gapminder 179
6.3 可視化工具DataWrapper 181
6.4 可視化工具Gephi 188
6.5 可視化工具QGIS 194
6.6 可視化工具ECharts 201
6.6.1 五分鐘上手ECharts 201
6.6.2 第一個ECharts作品 202
6.6.3 使用ECharts主題 206
6.7 可視化工具Tableau 207
6.7.1 安裝和簡介 208
6.7.2 連接數(shù)據(jù) 209
6.7.3 工作表 209
6.7.4 儀表板 210
6.7.5 故事 211
6.7.6 保存和導(dǎo)出 211
6.8 用Python和R實(shí)現(xiàn)可視化 215
小結(jié) 217
習(xí)題6 218
?
第7章 可視化作品發(fā)布 219
7.1 網(wǎng)絡(luò)基礎(chǔ)知識 219
7.2 HTML5基礎(chǔ) 220
7.2.1 HTML文檔 220
7.2.2 HTML常用標(biāo)簽 221
7.3 CSS3基礎(chǔ) 225
7.3.1 內(nèi)部CSS 225
7.3.2 外部CSS 228
7.4 JavaScript基礎(chǔ) 229
7.4.1 直接嵌入HTML使用 230
7.4.2 在HTML中調(diào)用 230
7.5 Web應(yīng)用框架和模板 231
7.5.1 Web應(yīng)用框架 231
7.5.2 Web模板 233
小 結(jié) 234
習(xí) 題 7 234
附錄A 數(shù)據(jù)可視化作品 235
附錄B 配套教學(xué)資源二維碼 237
參考文獻(xiàn) 238