環(huán)境數(shù)據(jù)分析(第二版)
定 價(jià):86 元
叢書名:科學(xué)出版社“十四五”普通高等教育本科規(guī)劃教材浙江省普通本科“十四五”重點(diǎn)教材
- 作者:莊樹林
- 出版時(shí)間:2023/11/1
- ISBN:9787030769053
- 出 版 社:科學(xué)出版社
- 中圖法分類:X32
- 頁(yè)碼:324
- 紙張:
- 版次:31
- 開本:16
本書是面向新工科建設(shè)的新形態(tài)教材,介紹了數(shù)理統(tǒng)計(jì)分析及機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的基礎(chǔ)理論和軟件操作,加強(qiáng)了統(tǒng)計(jì)分析和數(shù)據(jù)科學(xué)的融合。全書共12章,內(nèi)容包括數(shù)據(jù)描述性分析及探索性分析、科學(xué)繪圖、環(huán)境數(shù)據(jù)分布與假設(shè)檢驗(yàn)、參數(shù)及非參數(shù)檢驗(yàn)、方差分析、相關(guān)分析、回歸分析、生存分析、降維分析、聚類分析、分類分析及機(jī)器學(xué)習(xí)、深度學(xué)習(xí),特別設(shè)置了知識(shí)拓展、思考題、逸聞趣事等。本書重視實(shí)戰(zhàn)操作訓(xùn)練,演示了Excel、SPSS、Python及GPT-4的分析過程,對(duì)軟件操作及界面進(jìn)行了詳細(xì)介紹,完整展現(xiàn)了數(shù)據(jù)分析的思路和過程。所有習(xí)題、例題數(shù)據(jù)及解題方法均配套電子文件。
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
目錄
第二版前言
第一版序
第一版前言
第1章 數(shù)據(jù)統(tǒng)計(jì)描述與圖形化 1
1.1 數(shù)據(jù)統(tǒng)計(jì)概述 1
1.2 數(shù)據(jù)分析過程 3
1.3 數(shù)據(jù)基本類型 3
1.4 數(shù)據(jù)分析軟件 4
1.4.1 使用軟件 4
1.4.2 軟件安裝、運(yùn)行 5
1.5 數(shù)據(jù)探索性分析 7
1.5.1 數(shù)據(jù)管理 7
1.5.2 數(shù)據(jù)轉(zhuǎn)換 8
1.5.3 異常值及缺失值處理 8
1.6 數(shù)據(jù)描述性分析 9
1.6.1 集中趨勢(shì)描述 10
1.6.2 離散趨勢(shì)描述 10
1.6.3 頻率分析 12
1.7 數(shù)據(jù)圖形化形式 14
1.7.1 散點(diǎn)圖 14
1.7.2 線圖 16
1.7.3 面積圖 17
1.7.4 餅圖 18
1.7.5 條形圖 21
1.7.6 直方圖 23
1.7.7 誤差條圖 25
1.7.8 箱形圖 27
1.7.9 小提琴圖 29
1.7.10 森林圖 29
1.7.11 熱圖 31
習(xí)題 33
第2章 環(huán)境數(shù)據(jù)分布與假設(shè)檢驗(yàn) 35
2.1 總體與樣本 35
2.1.1 總體與樣本概述 35
2.1.2 樣本統(tǒng)計(jì)量與總體參數(shù) 35
2.1.3 抽樣 35
2.1.4 抽樣誤差 38
2.1.5 樣本量計(jì)算 38
2.1.6 統(tǒng)計(jì)功效 40
2.2 抽樣分布 40
2.2.1 抽樣分布概述 40
2.2.2 概率密度函數(shù) 41
2.2.3 正態(tài)分布 42
2.2.4 正態(tài)分布檢驗(yàn) 42
2.2.5 t分布 45
2.2.6 ??2分布 46
2.2.7 F分布 47
2.2.8 二項(xiàng)分布 48
2.3 參數(shù)估計(jì) 48
2.3.1 參數(shù)估計(jì)概念 48
2.3.2 點(diǎn)估計(jì) 48
2.3.3 置信區(qū)間估計(jì) 49
2.4 統(tǒng)計(jì)假設(shè)檢驗(yàn)基本思想 50
2.4.1 統(tǒng)計(jì)假設(shè)檢驗(yàn)概述 50
2.4.2 統(tǒng)計(jì)假設(shè)檢驗(yàn)基本步驟 50
2.4.3 統(tǒng)計(jì)假設(shè)檢驗(yàn)兩類錯(cuò)誤 51
2.4.4 單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn) 51
2.5 典型分布類型檢驗(yàn) 52
2.5.1 Z檢驗(yàn) 53
2.5.2 比率檢驗(yàn) 54
習(xí)題 56
第3章 環(huán)境數(shù)據(jù)t檢驗(yàn) 57
3.1 t檢驗(yàn)概述 57
3.1.1 t檢驗(yàn)定義 57
3.1.2 t檢驗(yàn)分類 57
3.1.3 t檢驗(yàn)適用條件 58
3.1.4 t檢驗(yàn)的分析流程 58
3.2 樣本t檢驗(yàn) 58
3.2.1 單樣本t檢驗(yàn) 58
3.2.2 獨(dú)立樣本t檢驗(yàn) 60
3.2.3 配對(duì)樣本t檢驗(yàn) 63
習(xí)題 66
第4章 環(huán)境數(shù)據(jù)方差分析 67
4.1 方差分析概述 67
4.1.1 方差分析定義 67
4.1.2 方差分析分類 67
4.1.3 方差分析基本術(shù)語(yǔ) 67
4.1.4 方差分析適用條件 68
4.1.5 方差分析基本流程 68
4.1.6 方差分析基本思想 68
4.1.7 多重比較 69
4.2 單因素方差分析 70
4.2.1 單因素方差分析概述 70
4.2.2 單因素方差分析基本步驟 70
4.2.3 方差分析趨勢(shì)檢驗(yàn) 74
4.3 雙因素方差分析 74
4.3.1 雙因素方差分析概述 74
4.3.2 有交互作用的雙因素方差分析 75
4.3.3 無(wú)交互作用的雙因素方差分析 80
4.4 多因素方差分析 83
4.4.1 多因素方差分析概述 83
4.4.2 多因素方差分析適用情形 83
4.5 重復(fù)測(cè)量方差分析 84
4.5.1 重復(fù)測(cè)量方差分析概述 84
4.5.2 重復(fù)測(cè)量方差分析適用條件 85
4.5.3 重復(fù)測(cè)量方差分析流程 86
4.6 協(xié)方差分析 88
4.6.1 協(xié)方差分析概述 88
4.6.2 協(xié)方差分析基本原理 88
4.6.3 協(xié)方差分析條件 88
4.7 Hotelling T 2檢驗(yàn) 89
4.7.1 Hotelling T?2檢驗(yàn)概述 89
4.7.2 Hotelling T 2數(shù)學(xué)模型 90
4.7.3 Hotelling T?2檢驗(yàn)適用條件 90
4.8 多元方差分析 92
4.8.1 多元方差分析概述 92
4.8.2 多元方差分析適用條件 93
4.9 常用試驗(yàn)設(shè)計(jì)方差分析 95
4.9.1 試驗(yàn)設(shè)計(jì)基本原則 95
4.9.2 完全隨機(jī)設(shè)計(jì) 95
4.9.3 隨機(jī)區(qū)組設(shè)計(jì) 95
4.9.4 配對(duì)設(shè)計(jì) 97
4.9.5 析因設(shè)計(jì) 97
4.9.6 正交設(shè)計(jì) 99
習(xí)題 100
第5章 環(huán)境數(shù)據(jù)非參數(shù)檢驗(yàn) 101
5.1 非參數(shù)檢驗(yàn) 101
5.1.1 非參數(shù)檢驗(yàn)概述 101
5.1.2 非參數(shù)檢驗(yàn)分類 101
5.1.3 非參數(shù)檢驗(yàn)的適用范圍 101
5.1.4 非參數(shù)檢驗(yàn)的特點(diǎn) 102
5.1.5 方法比較 102
5.2 單樣本非參數(shù)檢驗(yàn) 102
5.2.1 二項(xiàng)分布檢驗(yàn) 102
5.2.2 單樣本卡方檢驗(yàn) 104
5.2.3 K-S檢驗(yàn) 106
5.2.4 S-W檢驗(yàn) 107
5.3 兩配對(duì)樣本非參數(shù)檢驗(yàn) 108
5.3.1 兩配對(duì)樣本卡方檢驗(yàn) 108
5.3.2 符號(hào)檢驗(yàn) 112
5.3.3 Wilcoxon符號(hào)秩檢驗(yàn) 112
5.4 兩獨(dú)立樣本的非參數(shù)檢驗(yàn) 113
5.4.1 兩獨(dú)立樣本卡方檢驗(yàn) 116
5.4.2 分層卡方檢驗(yàn) 118
5.4.3 Mann-Whitney U檢驗(yàn) 119
5.4.4 兩獨(dú)立樣本K-S檢驗(yàn) 120
5.4.5 莫斯極端反應(yīng)檢驗(yàn) 121
5.5 多相關(guān)樣本非參數(shù)檢驗(yàn) 122
5.6 多獨(dú)立樣本非參數(shù)檢驗(yàn) 125
習(xí)題 127
第6章 環(huán)境數(shù)據(jù)相關(guān)分析 128
6.1 相關(guān)分析概述 128
6.1.1 相關(guān)分析定義 128
6.1.2 相關(guān)關(guān)系分類 128
6.1.3 相關(guān)分析類別 128
6.1.4 相關(guān)分析數(shù)據(jù)基本要求 129
6.1.5 相關(guān)分析樣本量計(jì)算 129
6.1.6 相關(guān)分析注意事項(xiàng) 129
6.2 相關(guān)系數(shù) 130
6.2.1 相關(guān)系數(shù)定義 130
6.2.2 相關(guān)程度 130
6.2.3 相關(guān)系數(shù)分類 130
6.2.4 相關(guān)系數(shù)熱力圖 131
6.3 Pearson相關(guān)分析 132
6.3.1 Pearson相關(guān)分析概念 132
6.3.2 Pearson相關(guān)系數(shù)公式 132
6.3.3 Pearson相關(guān)分析要求 132
6.4 Spearman等級(jí)相關(guān)分析 135
6.4.1 Spearman等級(jí)相關(guān)分析概念 135
6.4.2 Spearman等級(jí)相關(guān)系數(shù)公式 135
6.4.3 Spearman等級(jí)相關(guān)分析要求 135
6.5 Kendall等級(jí)相關(guān)分析 136
6.5.1 Kendall等級(jí)相關(guān)分析概念 136
6.5.2 Kendall’s tau-b相關(guān)系數(shù)公式 136
6.5.3 Kendall’s tau-b相關(guān)分析要求 137
6.6 偏相關(guān)分析 138
6.6.1 偏相關(guān)分析概述 138
6.6.2 偏相關(guān)系數(shù)公式 138
6.6.3 偏相關(guān)分析案例 139
習(xí)題 140
第7章 環(huán)境數(shù)據(jù)回歸分析 141
7.1 回歸分析概述 141
7.1.1 回歸分析定義 141
7.1.2 回歸分析分類 141
7.1.3 回歸分析基本術(shù)語(yǔ) 142
7.1.4 回歸分析基本步驟 142
7.1.5 回歸分析樣本量計(jì)算 143
7.1.6 回歸分析注意事項(xiàng) 143
7.2 線性回歸分析 144
7.2.1 線性回歸概念 144
7.2.2 線性回歸適用條件 144
7.2.3 線性回歸評(píng)價(jià)指標(biāo) 144
7.2.4 一元線性回歸 145
7.2.5 多元線性回歸 148
7.3 非線性回歸分析 152
7.3.1 非線性回歸概念 152
7.3.2 非線性回歸分類 153
7.4 多項(xiàng)式回歸分析 155
7.4.1 多項(xiàng)式回歸概述 155
7.4.2 一元n次多項(xiàng)式回歸 155
7.4.3 多元二次多項(xiàng)式回歸 158
7.5 Probit回歸 159
7.5.1 Probit回歸概念 159
7.5.2 二分類Probit回歸 159
7.6 Logistic回歸分析 161
7.6.1 Logistic回歸概念 161
7.6.2 Logistic回歸類型 162
7.6.3 Logistic回歸基本原理 162
7.6.4 Logistic回歸模型的假設(shè)檢驗(yàn) 163
7.6.5 Logistic回歸適用范圍 163
7.6.6 二元Logistic回歸 163
7.6.7 多元Logistic回歸 167
7.7 曲線擬合 169
7.7.1 曲線擬合概念 169
7.7.2 Logistic曲線擬合 170
7.7.3 環(huán)境庫(kù)茲涅茨曲線(EKC)擬合 172
7.8 貝葉斯核函數(shù)回歸 175
7.8.1 貝葉斯核函數(shù)回歸定義 175
7.8.2 貝葉斯核函數(shù)回歸應(yīng)用 175
習(xí)題 178
第8章 環(huán)境數(shù)據(jù)生存分析 179
8.1 生存分析 179
8.1.1 生存分析概述 179
8.1.2 生存分析組成 179
8.1.3 生存函數(shù) 180
8.1.4 生存曲線 180
8.1.5 生存分析種類 180
8.2 壽命表 181
8.2.1 壽命表概述 181
8.2.2 壽命表原理 181
8.3 Kaplan-Meier法 183
8.3.1 Kaplan-Meier法概述 183
8.3.2 Kaplan-Meier法與壽命表法比較 183
8.4 Cox回歸法 187
8.5 ROC曲線 192
8.5.1 ROC曲線概述 192
8.5.2 ROC空間 192
8.5.3 ROC曲線定義 193
8.5.4 AUC值 194
8.5.5 ROC曲線作用 194
8.5.6 ROC曲線可視化 195
習(xí)題 197
第9章 環(huán)境數(shù)據(jù)降維分析 198
9.1 數(shù)據(jù)降維 198
9.1.1 數(shù)據(jù)降維定義 198
9.1.2 數(shù)據(jù)降維作用 198
9.1.3 數(shù)據(jù)降維方法 198
9.2 因子分析 199
9.2.1 因子分析概述 199
9.2.2 因子分析算法 199
9.3 主成分分析 205
9.3.1 主成分分析概述 205
9.3.2 主成分分析算法 205
9.4 對(duì)應(yīng)分析 209
9.4.1 對(duì)應(yīng)分析概述 209
9.4.2 對(duì)應(yīng)分析算法 210
9.5 最優(yōu)尺度分析 213
9.5.1 最優(yōu)尺度分析概述 213
9.5.2 分類主成分分析 213
9.5.3 多重對(duì)應(yīng)分析 217
9.5.4 非線性典型相關(guān)分析 219
9.6 多維尺度分析 221
9.6.1 多維尺度分析概述 221
9.6.2 多維尺度分析原理 221
9.6.3 多維尺度分析類型 222
9.6.4 經(jīng)典多維尺度分析 222
9.6.5 標(biāo)準(zhǔn)化多維尺度分析 223
9.6.6 考慮個(gè)體差異的多維尺度分析 225
9.6.7 多維鄰近尺度分析 227
習(xí)題 228
第10章 環(huán)境數(shù)據(jù)聚類分析 229
10.1 聚類分析概述 229
10.1.1 聚類分析概念 229
10.1.2 聚類分析算法 230
10.1.3 聚類分析步驟 230
10.1.4 聚類統(tǒng)計(jì)量 232
10.1.5 聚類分析評(píng)估指標(biāo) 235
10.2 主要聚類算法 236
10.2.1 K-均值聚類 236
10.2.2 BIRCH層次聚類 241
10.2.3 兩步聚類 243
10.2.4 高斯混合聚類 245
10.2.5 DBSCAN聚類 247
10.2.6 CLIQUE聚類 248
習(xí)題 250
第11章 環(huán)境數(shù)據(jù)分類分析 252
11.1 分類分析概述 252
11.1.1 分類分析定義 252
11.1.2 分類分析類別 252
11.1.3 特征與標(biāo)簽 253
11.1.4 分類分析基本流程 253
11.1.5 常用分類算法 254
11.1.6 分類算法選擇 254
11.2 K最近鄰分類器 255
11.2.1 K最近鄰分類概述 255
11.2.2 Python中的KNN分類器 256
11.3 決策樹分類器 257
11.3.1 決策樹概述 257
11.3.2 Python中的決策樹 258
11.4 隨機(jī)森林分類器 259
11.4.1 隨機(jī)森林概述 259
11.4.2 Python中的隨機(jī)森林 260
11.5 支持向量機(jī)分類器 263
11.5.1 支持向量機(jī)概述 263
11.5.2 支持向量機(jī)基本思想 263
11.6 樸素貝葉斯分類器 264
11.6.1 樸素貝葉斯概述 264
11.6.2 Python中的樸素貝葉斯 265
11.7 集成學(xué)習(xí)分類器 266
11.7.1 AdaBoost算法 266
11.7.2 Python中的AdaBoost算法 267
習(xí)題 269
第12章 環(huán)境數(shù)據(jù)機(jī)器學(xué)習(xí) 270
12.1 機(jī)器學(xué)習(xí)概述 270
12.1.1 機(jī)器學(xué)習(xí)定義 270
12.1.2 機(jī)器學(xué)習(xí)分類 271
12.1.3 機(jī)器學(xué)習(xí)流程 271
12.2 數(shù)據(jù)收集與預(yù)處理 273
12.2.1 數(shù)據(jù)來(lái)源 273
12.2.2 數(shù)據(jù)預(yù)處理 274
12.3 特征工程 276
12.3.1 特征工程定義 276
12.3.2 特征工程步驟 276
12.3.3 特征選擇 276
12.3.4 特征提取 278
12.4 模型構(gòu)建 280
12.4.1 數(shù)據(jù)分割 280
12.4.2 模型訓(xùn)練 281
12.5 模型評(píng)估 283
12.5.1 預(yù)測(cè)誤差評(píng)估 283
12.5.2 擬合程度評(píng)估 286
12.6 機(jī)器學(xué)習(xí)基本框架 287
12.6.1 機(jī)器學(xué)習(xí)模板 287
12.6.2 機(jī)器學(xué)習(xí)案例分析 289
12.7 深度學(xué)習(xí) 293
12.7.1 深度學(xué)習(xí)定義 293
12.7.2 深度學(xué)習(xí)主流算法 294
12.7.3 深度學(xué)習(xí)框架 296
12.7.4 深度學(xué)習(xí)流程 297
12.7.5 基于Keras的深度學(xué)習(xí)模板 298
12.7.6 深度學(xué)習(xí)案例分析 300
習(xí)題 303
參考文獻(xiàn) 304