Python數(shù)據(jù)分析、挖掘與可視化
定 價:89 元
叢書名:面向新工科高等院校大數(shù)據(jù)專業(yè)系列教材
- 作者:毋建軍 姜波 編著
- 出版時間:2021/9/1
- ISBN:9787111687108
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:TP311.561
- 頁碼:340
- 紙張:
- 版次:
- 開本:16開
《Python數(shù)據(jù)分析、挖掘與可視化》從大數(shù)據(jù)分析實際業(yè)務流程出發(fā),利用案例貫穿介紹了大數(shù)據(jù)分析應具備的基礎開發(fā)技術,包括Python基礎、Python高級開發(fā)技術、數(shù)據(jù)采集與存儲、數(shù)據(jù)預處理、數(shù)據(jù)分析、數(shù)據(jù)可視化、數(shù)據(jù)挖掘等;詳細介紹了基于Python的數(shù)據(jù)分析全流程技術和相關機器學習算法;并通過社交用戶畫像挖掘案例,介紹了從應用場景需求分析→社交數(shù)據(jù)分析→用戶畫像構建的開發(fā)方法和過程,以及基于Flask框架、用戶屬性、神經(jīng)網(wǎng)絡挖掘的社交用戶數(shù)據(jù)分析和畫像構建過程。
《Python數(shù)據(jù)分析、挖掘與可視化》既可作為高等院校人工智能、計算機、大數(shù)據(jù)等專業(yè)的相關課程的教材,也可作為大數(shù)據(jù)分析人員的技術參考書。
前言
第1章 Python基礎1
1.1 Python概述1
1.2 Python大數(shù)據(jù)應用3
1.2.1 Python與大數(shù)據(jù)技術3
1.2.2 常用行業(yè)數(shù)據(jù)集6
1.2.3 嵌入式開發(fā)應用6
1.2.4 數(shù)據(jù)挖掘及應用7
1.2.5 機器學習及應用8
1.2.6 數(shù)據(jù)分析未來發(fā)展9
1.3 搭建Python開發(fā)環(huán)境10
1.3.1 Python開發(fā)環(huán)境系統(tǒng)要求10
1.3.2 Windows系統(tǒng)平臺下搭建開發(fā)環(huán)境10
1.3.3 Linux系統(tǒng)平臺下搭建開發(fā)環(huán)境12
1.3.4 Mac系統(tǒng)平臺下搭建開發(fā)環(huán)境13
1.4 Python集成開發(fā)平臺14
1.5 Python常用庫概述18
1.5.1 Python庫簡介18
1.5.2 Python庫安裝及集成19
1.5.3 Python數(shù)據(jù)分析工具21
1.6 創(chuàng)建Python程序21
1.6.1 在Anaconda下創(chuàng)建Python程序22
1.6.2 命令行創(chuàng)建Python程序25
1.6.3 Python運行在移動終端25
1.6.4 創(chuàng)建Python嵌入式程序27
習題28
第2章 Python高級開發(fā)29
2.1 字符串29
2.1.1 字符串及格式化29
2.1.2 字符串常用方法32
2.1.3 字符串匹配與正則表達式匹配33
2.1.4 字符串應用35
2.2 文本處理35
2.2.1 讀寫JSON數(shù)據(jù)35
2.2.2 讀寫CSV數(shù)據(jù)37
2.2.3 解析XML數(shù)據(jù)38
2.2.4 字典轉XML數(shù)據(jù)42
2.2.5 文本處理應用43
2.3 文件和流45
2.3.1 打開文件及模式45
2.3.2 文件處理方法46
2.3.3 文件應用47
2.4 網(wǎng)絡及Web應用48
2.4.1 創(chuàng)建TCP、UDP服務器48
2.4.2 RPC遠程訪問51
2.4.3 Python動態(tài)網(wǎng)站應用52
2.5 Python圖形繪制55
2.5.1 Python GUI簡介55
2.5.2 wxPython安裝及配置55
2.5.3 wxPython應用55
2.5.4 PySimpleGUI及Jython應用58
2.6 Python測試及框架60
習題63
第3章 Python數(shù)據(jù)采集與存儲64
3.1 數(shù)據(jù)采集簡介64
3.1.1 數(shù)據(jù)源概述64
3.1.2 常用的爬蟲框架66
3.1.3 社交網(wǎng)站信息采集75
3.2 Python數(shù)據(jù)存儲78
3.2.1 文本格式存儲78
3.2.2 文本存儲應用80
3.2.3 二進制格式存儲80
3.2.4 二進制存儲應用81
3.3 數(shù)據(jù)庫存儲81
3.3.1 Python 常用數(shù)據(jù)庫簡介82
3.3.2 MongoDB及應用82
3.3.3 Redis及應用93
3.3.4 SQLite及應用102
3.3.5 PyTables 及應用108
3.3.6 社交數(shù)據(jù)存儲112
3.4 案例:租房數(shù)據(jù)采集與存儲113
習題115
第4章 Python數(shù)據(jù)預處理116
4.1 數(shù)據(jù)預處理及工具簡介116
4.1.1 預處理基礎116
4.1.2 預處理方法117
4.1.3 預處理技術118
4.1.4 垃圾短信分類預處理120
4.2 NumPy122
4.2.1 NumPy安裝及配置123
4.2.2 NumPy的數(shù)據(jù)存取123
4.2.3 NumPy的矩陣構建126
4.2.4 NumPy 的矩陣運算128
4.2.5 NumPy的數(shù)學統(tǒng)計131
4.2.6 NumPy的排序運算134
4.2.7 NumPy處理缺失項136
4.3 pandas137
4.3.1 pandas安裝及配置138
4.3.2 pandas數(shù)據(jù)結構141
4.3.3 pandas 數(shù)據(jù)加載和存儲142
4.3.4 pandas數(shù)值計算與排序144
4.3.5 pandas數(shù)據(jù)索引構建147
4.3.6 pandas復雜數(shù)據(jù)結構148
4.3.7 書目信息索引149
4.4 SciPy150
4.4.1 SciPy安裝及配置151
4.4.2 SciPy的文件輸入與輸出152
4.4.3 SciPy的特殊函數(shù)應用152
4.4.4 SciPy的線性代數(shù)運算153
4.4.5 SciPy的快速傅里葉變換154
4.4.6 SciPy的優(yōu)化和擬合155
4.5 案例:社交網(wǎng)站數(shù)據(jù)預處理157
習題162
第5章 Python數(shù)據(jù)分析163
5.1 數(shù)據(jù)分析簡介163
5.1.1 數(shù)據(jù)分析發(fā)展163
5.1.2 數(shù)據(jù)分析主流技術164
5.1.3 數(shù)據(jù)分析應用領域166
5.2 Python 數(shù)據(jù)分析庫167
5.2.1 scikit-learn167
5.2.2 statsmodels170
5.2.3 Gensim172
5.2.4 Keras174
5.2.5 社交網(wǎng)站數(shù)據(jù)分析177
5.3 分類178
5.3.1 分類簡介179
5.3.2 常用分類算法179
5.3.3 分類評價標準181
5.3.4 新聞分類182
5.4 回歸184
5.4.1 回歸簡介184
5.4.2 常用回歸算法185
5.4.3 回歸評價標準187
5.4.4 房屋價格回歸分析188
5.5 聚類189
5.5.1 聚類簡介189
5.5.2 典型聚類算法189
5.5.3 聚類評價標準191
5.5.4 用戶社區(qū)聚類分析192
5.6 機器學習基礎194
5.6.1 機器學習簡介194
5.6.2 常見機器學習算法195
5.6.3 主流應用框架196
5.6.4 Theano 應用198
5.7 案例:購物網(wǎng)站用戶態(tài)度及情感分析199
習題201
第6章 Python 數(shù)據(jù)可視化202
6.1 數(shù)據(jù)可視化簡介202
6.1.1 數(shù)據(jù)可視化定義202
6.1.2 數(shù)據(jù)可視化發(fā)展203
6.1.3 數(shù)據(jù)可視化分類204
6.1.4 數(shù)據(jù)可視化應用205
6.2 數(shù)據(jù)可視化基礎206
6.2.1 數(shù)據(jù)可視化基本流程206
6.2.2 主流數(shù)據(jù)可視化分析技術207
6.2.3 人口遷移數(shù)據(jù)可視化209
6.3 數(shù)據(jù)可視化開發(fā)工具210
6.3.1 matplotlib210
6.3.2 NetworkX213
6.3.3 seaborn214
6.3.4 ggplot216
6.3.5 Bokeh217
6.3.6 Pygal219
6.3.7 Plotly221
6.3.8 pyecharts224
6.4 數(shù)據(jù)可視化分析框架227
6.5 案例:話題漂移可視化228
習題232
第7章 Python數(shù)據(jù)挖掘與應用233
7.1 數(shù)據(jù)挖掘簡介233
7.1.1 Python數(shù)據(jù)挖掘基礎234
7.1.2 文本分詞236
7.1.3 Gensim文本主題挖掘237
7.1.4 新詞發(fā)現(xiàn)242
7.2 Python視頻數(shù)據(jù)處理244
7.2.1 常見視頻數(shù)據(jù)處理算法244
7.2.2 OpenCV的基本操作245
7.2.3 scikit-video視頻讀寫操作248
7.2.4 MoviePy視頻編輯操作250
7.2.5 人物視頻識別檢測252
7.3 Python圖像數(shù)據(jù)處理255
7.3.1 常見圖像處理算法255
7.3.2 Python圖像處理庫260
7.3.3 手寫數(shù)字圖像及字體識別262
7.3.4 基于CNN的圖像識別應用267
7.4 案例:熱點話題挖掘272
習題277
第8章 綜合案例:社交用戶畫像
挖掘278
8.1 用戶畫像簡介278
8.1.1 用戶畫像基礎278
8.1.2 用戶畫像標簽體系281
8.1.3 搭建用戶畫像挖掘系統(tǒng)環(huán)境284
8.2 用戶屬性挖掘模塊286
8.2.1 基礎標簽創(chuàng)建286
8.2.2 標簽數(shù)據(jù)存儲290
8.2.3 用戶屬性可視化292
8.3 用戶興趣挖掘模塊295
8.3.1 用戶興趣挖掘295
8.3.2 用戶興趣數(shù)據(jù)存儲301
8.3.3 用戶興趣可視化302
8.4 用戶行為挖掘模塊305
8.4.1 行為挖掘305
8.4.2 基于神經(jīng)網(wǎng)絡的挖掘308
8.4.3 行為標簽存儲312
8.4.4 用戶行為關系可視化313
8.5 用戶畫像前端模塊315
8.5.1 標簽綜合視圖315
8.5.2 單個用戶畫像325
8.5.3 用戶群體畫像334
習題340