本書基于Python 3.10版本,使用Jupyter Notebook進行編程;以項目任務驅動模式,系統地闡述了Python數據分析的相關知識,內容包括Python數據分析概述、NumPy數值計算實戰(zhàn)、pandas統計分析實戰(zhàn)、Matplotlib數據可視化實戰(zhàn)、Python數據探索、數據預處理、基于sklearn的數據分析實戰(zhàn)、電商產品評論數據情感分析實戰(zhàn);通過多個實戰(zhàn)任務的學習與練習,讓讀者在短時間內掌握Python數據分析的技術和方法。為了方便讀者學習,本書附有配套源代碼、教學PPT、題庫、教學視頻、教學設計等資源。本書可作為高職院校人工智能、大數據相關專業(yè)數據分析課程的教材,也可作為從事數據分析工作的相關人員的參考用書。
蘆婭云,女,中共黨員,碩士,講師,工程師,“雙師”型教師, 曾獲高教創(chuàng)新教學論文一等獎,湖北省信息化教學設計大賽二等獎,全國微課大賽三等獎,廣東職協論文二等獎。參與省級科研成果獎項2項、獲個人軟著專利5項、公開發(fā)表省級國家級期刊論文10余篇、作為主要編著人參與編寫教材4本,其中,與騰訊公司合作主編教材《微信小程序開發(fā)》被評為廣東省省級精品課程。
項目1 Python數據分析概述 1
任務1.1 認識數據分析 2
任務1.2 搭建Anaconda環(huán)境 6
任務1.3 基于Jupyter Notebook創(chuàng)建餐飲訂單數據分析項目 12
項目2 NumPy數值計算實戰(zhàn) 15
任務2.1 數據的讀取與顯示 16
任務2.2 利用NumPy進行統計分析 18
項目3 pandas統計分析實戰(zhàn) 23
任務3.1 從CSV文件中讀取餐飲訂單數據 24
任務3.2 創(chuàng)建餐飲訂單數據的DataFrame 30
任務3.3 利用行列索引查看餐飲訂單數據的子集 34
任務3.4 生成餐飲訂單數據的銷售額 36
任務3.5 按給定的時間周期統計菜品或餐飲店的銷售額 38
任務3.6 按菜品拆分銷售額數據 43
項目4 Matplotlib數據可視化實戰(zhàn) 50
任務4.1 基于pyplot()函數繪制圖表和圖像 51
任務4.2 繪制餐飲訂單數據中日銷售額的散點圖 52
任務4.3 繪制餐飲訂單數據中某家餐飲店月銷售額的折線圖 54
任務4.4 繪制餐飲訂單數據中各家餐飲店月銷售額的直方圖 57
任務4.5 繪制餐飲訂單數據中各家餐飲店月銷售額的餅圖 59
任務4.6 繪制餐飲訂單數據中月銷售數量前五的銷售額的箱形圖 61
項目5 Python數據探索 64
任務5.1 餐飲訂單數據的缺失值分析 65
任務5.2 餐飲訂單數據的異常值分析 68
任務5.3 餐飲訂單數據的分布分析 69
任務5.4 餐飲訂單數據的周期性分析 72
任務5.5 餐飲訂單數據的相關性分析 74
任務5.6 餐飲訂單數據的貢獻度分析 75
任務5.7 餐飲訂單數據的統計量分析 77
項目6 數據預處理 79
任務6.1 清洗餐飲訂單數據 80
任務6.2 集成餐飲訂單數據 84
任務6.3 規(guī)約餐飲訂單數據 85
任務6.4 轉換餐飲訂單數據 87
任務6.5 分組與聚合餐飲訂單數據 89
項目7 基于sklearn的數據分析實戰(zhàn) 93
任務7.1 預處理廣州珠江水道水質化驗數據 94
任務7.2 劃分廣州珠江水道水質化驗數據的訓練集與測試集 99
任務7.3 構建與評價廣州珠江水道總氮濃度的回歸模型 101
任務7.4 構建廣州珠江水道水質類別的決策樹模型 103
任務7.5 基于餐飲訂單數據的銷售額預測分析 105
任務7.6 基于餐飲訂單數據的菜品關聯分析 110
任務7.7 基于iris數據集的鳶尾花聚類分析 115
項目8 電商產品評論數據情感分析實戰(zhàn) 120
任務8.1 電商產品評論數據的分詞處理 121
任務8.2 電商產品評論數據的詞性標注 124
任務8.3 電商產品評論數據的停用詞去除 127
任務8.4 電商產品評論數據的文本分類 132
任務8.5 電商產品評論數據的文本相似度計算 138
任務8.6 電商產品評論數據的文本情感分析 142