Python數(shù)據(jù)挖掘方法及應(yīng)用——知識(shí)圖譜(第2版)
定 價(jià):55 元
- 作者:王術(shù)
- 出版時(shí)間:2023/7/1
- ISBN:9787121459696
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP311.561
- 頁(yè)碼:236
- 紙張:
- 版次:01
- 開本:16開
本書重點(diǎn)介紹Python語言在數(shù)據(jù)處理與數(shù)據(jù)挖掘方面的應(yīng)用技巧,主要包括數(shù)據(jù)分析基礎(chǔ)知識(shí)(數(shù)據(jù)收集與分析軟件、數(shù)據(jù)挖掘的分析基礎(chǔ)、簡(jiǎn)單數(shù)據(jù)的統(tǒng)計(jì)分析),數(shù)據(jù)分析高級(jí)方法(多元數(shù)據(jù)的綜合分析、時(shí)序數(shù)據(jù)的模型分析),大數(shù)據(jù)基本處理方法(大數(shù)據(jù)分析基礎(chǔ)應(yīng)用、文獻(xiàn)計(jì)量與科研評(píng)價(jià)、社會(huì)網(wǎng)絡(luò)分析方法、數(shù)據(jù)分析編程平臺(tái))等內(nèi)容。附錄中還提供了Python數(shù)據(jù)分析相關(guān)方法和函數(shù)等,方便讀者隨時(shí)查看。本書內(nèi)容豐富,圖文并茂,可操作性強(qiáng)且便于查閱,主要面向數(shù)據(jù)分析的讀者,能有效幫助讀者提高數(shù)據(jù)處理與分析的水平,提升工作效率。書中的例子數(shù)據(jù)、習(xí)題數(shù)據(jù)及相關(guān)代碼都可在作者的學(xué)習(xí)博客http://blog.leanote.com/DaPy下載使用,也可登錄華信教育資源網(wǎng)http://www.hxedu.com.cn免費(fèi)下載。
王術(shù),暨南大學(xué)伯明翰大學(xué)聯(lián)合學(xué)院助理教授。比利時(shí)列日大學(xué)(與中國(guó)農(nóng)業(yè)科學(xué)院聯(lián)合培養(yǎng))博士。英國(guó)倫敦大學(xué)國(guó)王學(xué)院數(shù)據(jù)科學(xué)碩士,華南華南農(nóng)業(yè)大學(xué)經(jīng)濟(jì)學(xué)學(xué)士。研究領(lǐng)域?yàn)檗r(nóng)業(yè)經(jīng)濟(jì)、環(huán)境經(jīng)濟(jì)和能源經(jīng)濟(jì)及數(shù)據(jù)科學(xué)等交叉學(xué)科的研究。曾受國(guó)家留學(xué)基金委資助公派留學(xué)。發(fā)表SCI及中文期刊十余篇,其中第1作者SCI一區(qū)論文5篇(分別發(fā)表于本專業(yè)國(guó)際頂級(jí)期刊)。編寫并出版教材3部,掌握計(jì)算機(jī)編程語言與軟件開發(fā)能力,精通R語言和Python數(shù)據(jù)分析。王斌會(huì),暨南大學(xué)管理學(xué)院教授,博士生導(dǎo)師。國(guó)家和省級(jí)一流課程獲得者,暨南大學(xué)“十佳教學(xué)名師”。從事數(shù)學(xué)、統(tǒng)計(jì)學(xué)及經(jīng)濟(jì)管理教學(xué)和科研工作37年,發(fā)表科研論文100余篇,完成50多項(xiàng)國(guó)家和省部級(jí)課題,獲省部級(jí)以上科技進(jìn)步獎(jiǎng)3項(xiàng),獲省部級(jí)以上教學(xué)成果獎(jiǎng)2項(xiàng),一流課程4門,教學(xué)項(xiàng)目10余項(xiàng)。在數(shù)據(jù)分析和統(tǒng)計(jì)建模領(lǐng)域做了大量的基礎(chǔ)性研究與開創(chuàng)性工作。出版相關(guān)學(xué)術(shù)專著3部,出版相關(guān)教材10余本,開發(fā)計(jì)算機(jī)軟件10余套。精通大數(shù)據(jù)分析及統(tǒng)計(jì)語言的編程及數(shù)據(jù)處理云計(jì)算平臺(tái)的開發(fā)。詳情見其網(wǎng)站:www.yuque.com/rstat (www.jdwbh.cn/Rstat)
目錄
第1部分 數(shù)據(jù)挖掘基礎(chǔ)
第1章 Python數(shù)據(jù)挖掘基礎(chǔ) 4
1.1 數(shù)據(jù)挖掘軟件簡(jiǎn)介 5
1.1.1 基本數(shù)據(jù)挖掘軟件 5
1.1.2 Python語言介紹 6
1.2 Anaconda計(jì)算包 9
1.2.1 Anaconda的使用 9
1.2.2 Jupyter分析平臺(tái) 11
1.2.3 Spyder編程平臺(tái) 15
1.3 Python編程基礎(chǔ) 17
1.3.1 Python編程入門 17
1.3.2 Python數(shù)據(jù)類型 17
1.3.3 Python編程運(yùn)算 21
1.4 Python程序設(shè)計(jì) 23
1.4.1 Python數(shù)據(jù)分析包 24
1.4.2 數(shù)值分析包numpy 26
1.4.3 基本繪圖包matplotlib 27
數(shù)據(jù)及練習(xí)1 34
第2章 數(shù)據(jù)挖掘的基本方法 36
2.1 數(shù)據(jù)收集過程 37
2.1.1 常規(guī)數(shù)據(jù)收集 37
2.1.2 大數(shù)據(jù)的概念 42
2.1.3 數(shù)據(jù)管理 46
2.1.4 數(shù)據(jù)分析包pandas 48
2.2 數(shù)據(jù)的描述分析 56
2.2.1 基本統(tǒng)計(jì)量 56
2.2.2 基于數(shù)據(jù)框的繪圖 61
2.3 數(shù)據(jù)的透視分析 65
2.3.1 一維頻數(shù)分析 65
2.3.2 二維集聚分析 67
2.3.3 多維透視分析 72
數(shù)據(jù)及練習(xí)2 74
第3章 數(shù)據(jù)挖掘的統(tǒng)計(jì)基礎(chǔ) 76
3.1 均勻分布及其應(yīng)用 77
3.1.1 均勻分布的概念 77
3.1.2 均勻分布的應(yīng)用 78
3.2 正態(tài)分布及其應(yīng)用 81
3.2.1 正態(tài)分布簡(jiǎn)介 81
3.2.2 基本統(tǒng)計(jì)推斷 85
數(shù)據(jù)及練習(xí)3 87
第2部分 數(shù)值數(shù)據(jù)的挖掘
第4章 線性相關(guān)與回歸模型 90
4.1 兩變量相關(guān)與回歸分析 91
4.1.1 兩變量線性相關(guān)分析 91
4.1.2 兩變量線性回歸模型 93
4.2 多變量相關(guān)與回歸分析 95
4.2.1 多變量線性相關(guān)分析 95
4.2.2 多變量線性回歸模型 97
數(shù)據(jù)及練習(xí)4 107
第5章 時(shí)間序列數(shù)據(jù)分析 110
5.1 時(shí)間序列簡(jiǎn)介 111
5.1.1 時(shí)間序列的概念 111
5.1.2 時(shí)間序列的模擬 111
5.1.3 股票數(shù)據(jù)的分析 113
5.2 時(shí)間序列模型的構(gòu)建 114
5.2.1 ARIMA模型 114
5.2.2 ARMA模型的構(gòu)建 119
5.2.3 ARMA模型的建立與檢驗(yàn) 123
5.3 時(shí)間序列模型的應(yīng)用 129
5.3.1 模型的預(yù)處理 130
5.3.2 模型的估計(jì)與檢驗(yàn) 131
5.3.3 模型的預(yù)測(cè)分析 133
數(shù)據(jù)及練習(xí)5 133
第6章 多元數(shù)據(jù)的統(tǒng)計(jì)分析 135
6.1 綜合評(píng)價(jià)方法 136
6.1.1 綜合評(píng)價(jià)指標(biāo)體系 136
6.1.2 綜合評(píng)價(jià)分析方法 138
6.2 主成分分析方法 144
6.2.1 主成分分析方法的基本思想 144
6.2.2 主成分的基本分析 146
6.3 聚類分析方法 151
6.3.1 聚類分析方法的概念 151
6.3.2 系統(tǒng)聚類方法 153
數(shù)據(jù)及練習(xí)6 158
第3部分 文本數(shù)據(jù)的挖掘
第7章 簡(jiǎn)單文本處理方法 162
7.1 字符串處理 163
7.1.1 字符串的基本操作 163
7.1.2 字符串查詢與替換 164
7.2 簡(jiǎn)單文本處理 165
7.2.1 文本挖掘的概念 165
7.2.2 文本數(shù)據(jù)的分詞 167
7.3 網(wǎng)絡(luò)數(shù)據(jù)的爬蟲 170
7.3.1 網(wǎng)頁(yè)的基礎(chǔ)知識(shí) 170
7.3.2 Python爬蟲步驟 171
7.3.3 爬蟲方法的應(yīng)用 173
數(shù)據(jù)及練習(xí)7 180
第8章 社會(huì)網(wǎng)絡(luò)與知識(shí)圖譜 182
8.1 社會(huì)網(wǎng)絡(luò)的初步印象 183
8.1.1 社會(huì)網(wǎng)絡(luò)分析概念 183
8.1.2 社會(huì)網(wǎng)絡(luò)分析包 184
8.2 社會(huì)網(wǎng)絡(luò)圖的構(gòu)建 185
8.2.1 社會(huì)網(wǎng)絡(luò)數(shù)據(jù)形式 185
8.2.2 社會(huì)網(wǎng)絡(luò)統(tǒng)計(jì)量 188
8.2.3 美化社會(huì)網(wǎng)絡(luò)圖 191
8.3 商業(yè)數(shù)據(jù)知識(shí)圖譜應(yīng)用 194
8.3.1 關(guān)聯(lián)規(guī)則分析概念入門 194
8.3.2 關(guān)聯(lián)規(guī)則分析基礎(chǔ)應(yīng)用 195
8.3.3 關(guān)聯(lián)規(guī)則可視化分析 197
8.3.4 大樣本關(guān)聯(lián)規(guī)則實(shí)戰(zhàn) 199
數(shù)據(jù)及練習(xí)8 203
第9章 文獻(xiàn)計(jì)量與知識(shí)圖譜 204
9.1 文獻(xiàn)計(jì)量研究的框架 205
9.2 文獻(xiàn)數(shù)據(jù)的收集與分析 206
9.2.1 文獻(xiàn)數(shù)據(jù)的獲取 206
9.2.2 文獻(xiàn)數(shù)據(jù)的分析 209
9.3 科研數(shù)據(jù)的管理與評(píng)價(jià) 213
9.3.1 科研單位與項(xiàng)目分析 213
9.3.2 科研期刊與作者分析 215
9.3.3 圖譜共現(xiàn)矩陣計(jì)算 217
9.3.4 共現(xiàn)矩陣的網(wǎng)絡(luò)圖 218
數(shù)據(jù)及練習(xí)9 221
附錄 資源共享平臺(tái)與云計(jì)算平臺(tái) 222
附錄A 資源共享平臺(tái) 222
A1 本書的學(xué)習(xí)網(wǎng)站 222
A2 本書自定義函數(shù) 223
附錄B 云計(jì)算平臺(tái)簡(jiǎn)介 225
B1 課程學(xué)習(xí)平臺(tái) 225
B2 習(xí)題解答平臺(tái) 226
參考文獻(xiàn) 228