大數(shù)據(jù)分析與挖掘?qū)嶒灲坛?/p>
定 價:46 元
- 作者:萬欣
- 出版時間:2023/6/1
- ISBN:9787121456909
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:160
- 紙張:
- 版次:01
- 開本:16開
本書是一本面向數(shù)據(jù)科學(xué)初學(xué)者的實驗教材。本書旨在通過實驗的方式,幫助學(xué)生掌握數(shù)據(jù)分析和挖掘的基本概念、方法和技術(shù),并學(xué)會使用Python等工具進行實際操作。本書的實驗設(shè)計涵蓋了數(shù)據(jù)預(yù)處理、數(shù)據(jù)可視化、分類與預(yù)測、聚類與關(guān)聯(lián)規(guī)則挖掘、文本挖掘、網(wǎng)絡(luò)分析、時間序列分析、情感分析和主題模型等多個方面,旨在培養(yǎng)學(xué)生的數(shù)據(jù)思維和實際操作能力,為學(xué)生日后從事數(shù)據(jù)科學(xué)工作打下堅實的基礎(chǔ)。本書的實驗設(shè)計遵循理論與實踐相結(jié)合的原則,每個實驗都提供了詳細的理論知識和實驗步驟,以及實驗數(shù)據(jù)和代碼。通過實驗,學(xué)生可以熟悉數(shù)據(jù)分析與挖掘的實際操作流程,了解各種數(shù)據(jù)分析與挖掘方法的優(yōu)缺點以及應(yīng)用場景。同時,本書還鼓勵學(xué)生進行自主思考和創(chuàng)新,通過實驗提高學(xué)生解決問題的能力和創(chuàng)新能力。
萬欣,武漢紡織大學(xué)管理學(xué)院副教授,碩士生導(dǎo)師,武漢紡織大學(xué)大數(shù)據(jù)與效益制造中心主任,湖北省一流課程“商務(wù)智能”負責(zé)人;畢業(yè)于日本電氣通信大學(xué),工學(xué)博士(社會智能信息學(xué)),主要研究方向有商務(wù)智能、機器學(xué)習(xí)、數(shù)據(jù)挖掘等;曾就職于國內(nèi)外多家上市公司,從事技術(shù)研發(fā)、軟件開發(fā)工作;在大數(shù)據(jù)分析與挖掘領(lǐng)域教學(xué)經(jīng)驗豐富。
第一章 數(shù)據(jù)預(yù)處理 1
第一節(jié) 數(shù)據(jù)清洗 2
第二節(jié) 數(shù)據(jù)集成 3
第三節(jié) 數(shù)據(jù)變換 5
第四節(jié) 數(shù)據(jù)規(guī)約 7
第五節(jié) Python中的數(shù)據(jù)預(yù)處理工具 8
小結(jié) 14
第二章 數(shù)據(jù)可視化 15
第一節(jié) 理解數(shù)據(jù)可視化的概念和重要性 16
第二節(jié) 使用Python的matplotlib和seaborn庫繪制基本圖形 17
第三節(jié) 繪制柱狀圖、折線圖、散點圖、箱線圖等常見圖形 21
第四節(jié) 利用圖形展示數(shù)據(jù)的關(guān)系和趨勢、數(shù)據(jù)的分析 24
第五節(jié) 利用交互式可視化工具進行高級數(shù)據(jù)可視化 29
小結(jié) 33
第三章 分類與預(yù)測 34
第一節(jié) 理解分類與預(yù)測的概念和應(yīng)用場景 35
第二節(jié) 理解機器學(xué)習(xí)分類算法的基本原理 36
第三節(jié) 利用Python的scikit-learn庫進行分類算法的實現(xiàn) 43
第四節(jié) 利用交叉驗證、網(wǎng)格搜索等方法對分類算法進行優(yōu)化 47
小結(jié) 51
第四章 聚類與關(guān)聯(lián)規(guī)則挖掘 52
第一節(jié) 理解聚類與關(guān)聯(lián)規(guī)則挖掘的概念和應(yīng)用場景 53
第二節(jié) 理解聚類算法的基本原理 54
第三節(jié) 利用Python的scikit-learn庫進行聚類算法的實現(xiàn) 55
第四節(jié) 理解關(guān)聯(lián)規(guī)則挖掘的基本原理:Apriori算法 60
第五節(jié) 利用Python的mlxtend庫進行關(guān)聯(lián)規(guī)則挖掘的實現(xiàn) 64
小結(jié) 66
第五章 文本挖掘 67
第一節(jié) 理解文本挖掘的概念和應(yīng)用場景 68
第二節(jié) 理解自然語言處理的基本概念及技術(shù) 69
第三節(jié) 利用Python的NLTK和jieba庫進行文本預(yù)處理 71
第四節(jié) 理解文本分類的基本原理和算法 79
第五節(jié) 利用Python的scikit-learn和keras庫進行文本分類的實現(xiàn) 83
小結(jié) 88
第六章 網(wǎng)絡(luò)分析 89
第一節(jié) 理解網(wǎng)絡(luò)分析的概念、應(yīng)用場景和工具 90
第二節(jié) 理解網(wǎng)絡(luò)的基本概念 93
第三節(jié) 利用Python的NetworkX庫進行網(wǎng)絡(luò)構(gòu)建和分析 95
第四節(jié) 理解社交網(wǎng)絡(luò)分析的基本原理和方法 98
第五節(jié) 利用Python的igraph庫進行社交網(wǎng)絡(luò)分析的實現(xiàn) 101
小結(jié) 104
第七章 時間序列分析 105
第一節(jié) 理解時間序列分析的概念和應(yīng)用場景 106
第二節(jié) 理解時間序列的基本概念 106
第三節(jié) 利用Python的pandas庫進行時間序列數(shù)據(jù)的處理和分析 107
第四節(jié) 理解時間序列預(yù)測的基本原理和方法 109
第五節(jié) 利用Python的statsmodels庫進行時間序列預(yù)測的實現(xiàn) 111
小結(jié) 113
第八章 情感分析 115
第一節(jié) 理解情感分析的概念和應(yīng)用場景 116
第二節(jié) 理解自然語言處理中的情感分析基本原理和方法 117
第三節(jié) 利用Python的NLTK和SnowNLP庫進行情感分析的實現(xiàn) 118
第四節(jié) 理解深度學(xué)習(xí)在情感分析中的應(yīng)用 121
第五節(jié) 利用Python的keras和tensorflow庫進行深度學(xué)習(xí)情感分析
的實現(xiàn) 124
小結(jié) 127
第九章 主題模型 129
第一節(jié) 理解主題模型的概念和應(yīng)用場景 130
第二節(jié) 理解主題模型的基本原理和方法 131
第三節(jié) 利用Python的gensim和scikit-learn庫進行主題模型的實現(xiàn) 133
第四節(jié) 理解主題模型在文本分析、信息檢索和推薦系統(tǒng)中的應(yīng)用 141
第五節(jié) 利用主題模型進行文本主題分析和推薦系統(tǒng)的 實現(xiàn) 142
小結(jié) 145
附錄A 實驗環(huán)境搭建 146
后記 148