對照Excel,零基礎學Python數(shù)據(jù)分析
定 價:69.8 元
- 作者:楊開振
- 出版時間:2023/6/1
- ISBN:9787115607881
- 出 版 社:人民郵電出版社
- 中圖法分類:TP311.561
- 頁碼:230
- 紙張:
- 版次:01
- 開本:16開
本書主要介紹如何使用Python處理Excel數(shù)據(jù)。本書內容分為三大部分:第一部分主要介紹數(shù)據(jù)分析的概念和Python基礎;第二部分通過蜂蜜電商數(shù)據(jù)分析案例詳細介紹數(shù)據(jù)分析的技術要點,包括讀寫Excel文件所需的xlwings庫和openpyxl庫、數(shù)據(jù)分析的pandas核心庫,以及數(shù)據(jù)可視化常用的Matplotlib庫和Seaborn庫;第三部分包括個人消費貸款數(shù)據(jù)分析和螺螄粉連鎖店銷售數(shù)據(jù)分析兩個實踐案例,通過實踐案例幫助讀者回顧理論知識并提高實踐能力。
本書適合Python零基礎且需要處理大量Excel數(shù)據(jù)的辦公人員閱讀,也可以作為學習Python數(shù)據(jù)分析的入門教程。
·圍繞數(shù)據(jù)分析的全流程,系統(tǒng)、全面地介紹數(shù)據(jù)分析的主要知識點。
·對照Excel學習Python數(shù)據(jù)分析,降低學習門檻,方便快速上手。
·知識點全面,覆蓋xlwings、openpyxl、pandas、Matplotlib和Seaborn等常用庫。
·突出案例實戰(zhàn),幫助讀者形成數(shù)據(jù)分析的思維模式。
·提供書中用到的Excel文件和對應的Python源代碼,供讀者免費下載使用。
計算機軟件開發(fā)者和原創(chuàng)圖書作者,Java和Python雙修程序員,著有《深入淺出Spring Boot 2.x》《Python+Excel辦公自動化一本通》《Java EE互聯(lián)網輕量級框架整合開發(fā):SSM+Redis+Spring微服務》等圖書。
第 一部分 數(shù)據(jù)分析的概念和Python基礎
第 1章 數(shù)據(jù)分析基礎知識 2
1.1 為什么要做數(shù)據(jù)分析 2
1.1.1 分析現(xiàn)狀 3
1.1.2 分析具體問題 3
1.1.3 預測未來 3
1.2 為什么要使用Python做數(shù)據(jù)分析 4
1.2.1 數(shù)據(jù)分析的歷史 4
1.2.2 為什么Python+Excel會成為數(shù)據(jù)分析的主流工具 5
1.2.3 使用Python做數(shù)據(jù)分析的優(yōu)勢 6
1.3 數(shù)據(jù)分析的對象 7
1.3.1 總體指標分析 7
1.3.2 對比分析 7
1.3.3 按時間維度分析 7
1.3.4 概率學分析 7
1.3.5 按指定維度分析 7
1.4 數(shù)據(jù)分析的流程 8
1.4.1 數(shù)據(jù)獲取 8
1.4.2 數(shù)據(jù)處理 8
1.4.3 數(shù)據(jù)篩選 9
1.4.4 數(shù)據(jù)分析 9
1.4.5 結果保存 9
1.4.6 數(shù)據(jù)可視化 9
1.4.7 數(shù)據(jù)追蹤和驗證 9
第 2章 Python基礎知識 10
2.1 安裝Python和PyCharm 10
2.1.1 安裝Python 10
2.1.2 安裝和使用PyCharm 12
2.2 變量 13
2.2.1 變量的使用 13
2.2.2 變量的命名 14
2.3 簡單的數(shù)據(jù)類型 17
2.3.1 數(shù)字 17
2.3.2 字符串 22
2.4 控制語句 28
2.4.1 條件語句 28
2.4.2 循環(huán)語句 35
第3章 Python中的高級概念 41
3.1 復雜的數(shù)據(jù)類型 41
3.1.1 列表 41
3.1.2 字典 44
3.1.3 元組和集合 46
3.2 函數(shù) 47
3.2.1 函數(shù)的定義 48
3.2.2 指定函數(shù)參數(shù)的關鍵字和默認值 49
3.2.3 函數(shù)內外變量的可見性 50
3.2.4 傳遞可更改對象與不可更改對象 51
3.2.5 把函數(shù)放在不同的模塊中 52
3.3 類 53
3.4 異常 54
3.5 文件操作 57
3.5.1 讀取CSV文件 57
3.5.2 寫入文件 59
第二部分 蜂蜜電商數(shù)據(jù)分析
第4章 讀取和清洗數(shù)據(jù) 62
4.1 業(yè)務分析 62
4.1.1 銷售明細表分析 62
4.1.2 產品信息表分析 63
4.1.3 用戶信息表分析 63
4.1.4 銷售員信息表分析 64
4.1.5 數(shù)據(jù)關聯(lián) 64
4.2 讀取Excel數(shù)據(jù) 64
4.2.1 安裝對應的庫 65
4.2.2 讀取簡單的Excel數(shù)據(jù) 67
4.2.3 pandas DataFrame 68
4.2.4 pandas Series 70
4.2.5 讀取特殊格式的Excel數(shù)據(jù) 70
4.2.6 使用xlwings讀取Excel數(shù)據(jù) 73
4.3 清洗數(shù)據(jù) 76
4.3.1 去除空記錄 76
4.3.2 去除非法數(shù)據(jù) 78
4.3.3 去除重復數(shù)據(jù) 80
4.3.4 設置默認值 82
4.4 編寫讀寫文件的代碼 83
第5章 篩選數(shù)據(jù) 85
5.1 通過條件篩選數(shù)據(jù) 86
5.1.1 篩選多個用戶的銷售明細數(shù)據(jù) 87
5.1.2 通過商品數(shù)量和實際交易金額篩選數(shù)據(jù) 88
5.1.3 對用戶名稱進行模糊查詢 89
5.1.4 多條件查詢銷售明細數(shù)據(jù) 89
5.2 通過交易日期篩選數(shù)據(jù) 91
5.2.1 根據(jù)年、月、季篩選數(shù)據(jù) 93
5.2.2 篩選當前日期的數(shù)據(jù) 94
5.2.3 篩選某個時間區(qū)間內的數(shù)據(jù) 95
第6章 數(shù)據(jù)的基礎運算 96
6.1 算術運算 96
6.1.1 通過加減運算驗證數(shù)據(jù)的合法性 96
6.1.2 通過乘除運算驗證數(shù)據(jù)的合法性 97
6.2 比較運算 98
6.3 通過函數(shù)運算數(shù)據(jù) 99
6.3.1 常用函數(shù) 100
6.3.2 不常用函數(shù) 101
6.3.3 按行統(tǒng)計 102
第7章 把數(shù)據(jù)連接起來 105
7.1 3種關聯(lián)關系 107
7.1.1 銷售員信息表和工卡信息表的關聯(lián)(一對一關聯(lián)) 107
7.1.2 指定關聯(lián)字段 108
7.1.3 處理重復列 109
7.1.4 連接方式 110
7.2 合并多個Excel文件的數(shù)據(jù) 113
7.2.1 合并數(shù)據(jù) 113
7.2.2 重置索引和去重 114
第8章 分組統(tǒng)計、數(shù)據(jù)透視表和排序 115
8.1 分組統(tǒng)計數(shù)據(jù) 115
8.1.1 按訂單狀態(tài)匯總數(shù)據(jù) 116
8.1.2 使用agg()方法 116
8.1.3 實踐 118
8.1.4 按蜂蜜類型進行統(tǒng)計——統(tǒng)計關聯(lián)數(shù)據(jù) 118
8.1.5 按多列進行分組統(tǒng)計 119
8.2 數(shù)據(jù)透視表 119
8.2.1 轉換視角 120
8.2.2 數(shù)據(jù)分組統(tǒng)計和分析 121
8.2.3 合計行列 123
8.3 排序 125
8.3.1 按實際交易金額排序(單列排序) 126
8.3.2 按實際交易金額和交易日期排序(多列排序) 126
8.3.3 按優(yōu)惠金額排序(含空值行的排序) 127
8.3.4 對交易日期降序排名 128
第9章 數(shù)據(jù)可視化 132
9.1 柱形圖和圖表基礎 133
9.1.1 柱形圖的繪制和坐標軸的概念 133
9.1.2 設置坐標軸 136
9.1.3 給圖表添加文本標簽和注釋 138
9.1.4 設置網格 140
9.1.5 同比柱形圖和圖例的使用 141
9.1.6 溫度計圖 146
9.1.7 數(shù)據(jù)表 147
9.2 繪制常見的圖表 149
9.2.1 折線圖 149
9.2.2 條形圖 151
9.2.3 餅圖 153
9.2.4 雷達圖 156
9.3 其他常用的圖表技術 159
9.3.1 多種圖表組合——雙軸圖 160
9.3.2 在同一畫布中繪制多個圖表 163
9.3.3 設置圖表樣式 165
9.3.4 初探Seaborn 167
9.3.5 圖表的保存 169
第 10章 保存數(shù)據(jù)和圖表到Excel文件中 171
10.1 簡單保存數(shù)據(jù)到Excel文件中 171
10.1.1 不保存行索引并保存數(shù)據(jù)到指定工作表中 172
10.1.2 選擇要保存的列 172
10.2 使用xlwings保存數(shù)據(jù)到Excel文件中 173
10.2.1 將不同的數(shù)據(jù)保存到同一個Excel文件的不同工作表中 173
10.2.2 將結果寫入多個Excel文件 174
10.2.3 格式化 175
10.2.4 保存圖表 178
第三部分 實踐案例
第 11章 個人消費貸款數(shù)據(jù)分析 182
11.1 業(yè)務和數(shù)據(jù)特點分析 182
11.1.1 貸款臺賬表業(yè)務分析 182
11.1.2 客戶經理信息表業(yè)務分析 184
11.1.3 數(shù)據(jù)關聯(lián) 184
11.2 數(shù)據(jù)處理 185
11.2.1 驗證和修復數(shù)據(jù) 185
11.2.2 讀取數(shù)據(jù) 186
11.3 數(shù)據(jù)篩選 187
11.3.1 簡單地篩選數(shù)據(jù) 187
11.3.2 模糊查詢 188
11.3.3 按多個條件篩選數(shù)據(jù) 189
11.3.4 查找十大存量貸款記錄 191
11.4 統(tǒng)計分析 192
11.4.1 使用分組方法groupby()按風險狀態(tài)分組進行統(tǒng)計 192
11.4.2 使用數(shù)據(jù)透視表按季度統(tǒng)計分析數(shù)據(jù) 195
11.4.3 使用數(shù)據(jù)透視表按月份統(tǒng)計貸款筆數(shù)和發(fā)生額 198
11.5 通過數(shù)據(jù)關聯(lián)查詢和統(tǒng)計分析數(shù)據(jù) 200
11.5.1 通過關聯(lián)查詢數(shù)據(jù) 200
11.5.2 關聯(lián)客戶經理信息表并統(tǒng)計分析數(shù)據(jù) 201
11.6 數(shù)據(jù)可視化 202
11.6.1 繪制折線圖展示兩年各月份的貸款數(shù)據(jù) 202
11.6.2 繪制柱形圖對比兩年各季度的貸款發(fā)生額 205
11.6.3 繪制餅圖展示各業(yè)務品種貸款余額 207
11.7 保存結果 209
第 12章 螺螄粉連鎖店銷售數(shù)據(jù)分析 211
12.1 業(yè)務分析 211
12.1.1 店鋪銷售月報數(shù)據(jù) 211
12.1.2 商品信息表 212
12.2 讀取數(shù)據(jù) 214
12.2.1 遍歷文件 214
12.2.2 讀取商品信息表數(shù)據(jù) 215
12.2.3 讀取銷售月報數(shù)據(jù) 216
12.2.4 讀取工作表的數(shù)據(jù) 217
12.2.5 合并數(shù)據(jù) 220
12.2.6 測試讀取文件與合并數(shù)據(jù) 220
12.3 整理和分析數(shù)據(jù) 221
12.3.1 整理數(shù)據(jù) 221
12.3.2 分析數(shù)據(jù) 223
12.4 數(shù)據(jù)可視化 224
12.4.1 繪制店鋪月交易金額條形圖 224
12.4.2 繪制按店鋪統(tǒng)計銷量和金額雙軸圖 225
12.5 保存結果 227