本書內(nèi)容主要包括機器學(xué)習的基本知識、基本學(xué)習方法、集成學(xué)習方法、深度學(xué)習方法和深度強化學(xué)習方法等內(nèi)容,將機器學(xué)習的經(jīng)典內(nèi)容與深度學(xué)習等前沿內(nèi)容有機地結(jié)合在一起,形成一套相對完整的知識體系,并在每個章節(jié)穿插相應(yīng)的應(yīng)用實例,使得廣大讀者不但能夠較好地掌握機器學(xué)習基本理論,而且能夠比較系統(tǒng)地掌握其應(yīng)用技術(shù),為今后的工作和進一步學(xué)習打下扎實的理論與應(yīng)用基礎(chǔ)。
前言
第1章 機器學(xué)習概述 1
1.1 機器學(xué)習基本概念 1
1.1.1 人工智能與機器學(xué)習 1
1.1.2 機器學(xué)習基本術(shù)語 5
1.1.3 機器學(xué)習誤差分析 8
1.2 機器學(xué)習發(fā)展歷程 11
1.2.1 感知機與連接學(xué)習 11
1.2.2 符號學(xué)習與統(tǒng)計學(xué)習 13
1.2.3 連接學(xué)習的興起 17
1.3 機器學(xué)習基本問題 19
1.3.1 特征提取 19
1.3.2 規(guī)則構(gòu)建 23
1.3.3 模型評估 27
1.4 模型優(yōu)化與正則化 31
1.4.1 梯度下降法 31
1.4.2 隨機梯度法 34
1.4.3 模型正則化 36
1.5 習題 41
第2章 基本學(xué)習方法 43
2.1 監(jiān)督學(xué)習 43
2.1.1 線性模型 43
2.1.2 決策樹模型 50
2.1.3 貝葉斯模型 62
2.1.4 支持向量機 68
2.2 無監(jiān)督學(xué)習 72
2.2.1 聚類分析法 72
2.2.2 主分量分析法 76
2.3 強化學(xué)習 81
2.3.1 強化學(xué)習概述 81
2.3.2 馬爾可夫模型 84
2.3.3 值迭代學(xué)習 89
2.3.4 時序差分學(xué)習 94
2.4 基本學(xué)習方法的應(yīng)用 103
2.4.1 垃圾郵件檢測與分類 103
2.4.2 人臉自動識別 106
2.4.3 自動爬山小車 112
2.5 習題 117
第3章 集成學(xué)習方法 119
3.1 集成學(xué)習概述 119
3.1.1 集成學(xué)習基本概念 119
3.1.2 集成學(xué)習基本范式 120
3.1.3 集成學(xué)習泛化策略 122
3.2 Bagging集成學(xué)習 124
3.2.1 Bagging集成策略 124
3.2.2 隨機森林模型結(jié)構(gòu) 127
3.2.3 隨機森林訓(xùn)練算法 129
3.3 Boosting集成學(xué)習 142
3.3.1 Boosting集成策略 143
3.3.2 AdaBoost學(xué)習算法 145
3.3.3 GBDT學(xué)習算法 146
3.4 集成學(xué)習方法的應(yīng)用 151
3.4.1 房價預(yù)測分析 151
3.4.2 人臉自動檢測 156
3.5 習題 162
第4章 深度學(xué)習方法 163
4.1 神經(jīng)網(wǎng)絡(luò)概述 163
4.1.1 神經(jīng)元與感知機 163
4.1.2 前饋網(wǎng)絡(luò)訓(xùn)練范式 168
4.1.3 淺層學(xué)習與深度學(xué)習 176
4.2 深度卷積網(wǎng)絡(luò) 181
4.2.1 卷積網(wǎng)絡(luò)概述 181
4.2.2 基本網(wǎng)絡(luò)模型 190
4.2.3 改進網(wǎng)絡(luò)模型 199
4.3 深度循環(huán)網(wǎng)絡(luò) 206
4.3.1 動態(tài)系統(tǒng)展開 207
4.3.2 網(wǎng)絡(luò)結(jié)構(gòu)與計算 208
4.3.3 模型訓(xùn)練策略 217
4.4 生成式對抗網(wǎng)絡(luò) 221
4.4.1 生成器與判別器 222
4.4.2 網(wǎng)絡(luò)結(jié)構(gòu)與計算 224
4.4.3 模型訓(xùn)練策略 229
4.5 深度學(xué)習方法的應(yīng)用 234
4.5.1 光學(xué)字符識別 235
4.5.2 圖像目標檢測 239
4.5.3 自動文本摘要 245
4.6 習題 249
第5章 深度強化學(xué)習 251
5.1 深度強化學(xué)習概述 251
5.1.1 基本學(xué)習思想 251
5.1.2 基本計算方式 254
5.1.3 蒙特卡洛樹搜索 255
5.2 基于價值的深度強化學(xué)習 261
5.2.1 深度Q網(wǎng)絡(luò) 261
5.2.2 深度雙Q網(wǎng)絡(luò) 266
5.2.3 DQN改進模型 270
5.3 基于策略的深度強化學(xué)習 273
5.3.1 策略梯度算法 273
5.3.2 Actor-Critic算法 278
5.3.3 DDPG學(xué)習算法 284
5.4 深度強化學(xué)習的應(yīng)用 288
5.4.1 智能巡航小車 288
5.4.2 自動對弈游戲 292
5.5 習題 303
參考文獻 305