機器學習中的概率統(tǒng)計——Python語言描述
定 價:79 元
叢書名:智能系統(tǒng)與技術(shù)叢書
- 作者:張雨萌
- 出版時間:2020/12/1
- ISBN:9787111669357
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:TP181
- 頁碼:0
- 紙張:
- 版次:
- 開本:32開
內(nèi)容簡介
本書圍繞機器學習算法中涉及的概率統(tǒng)計知識展開介紹,沿著概率思想、變量分布、參數(shù)估計、隨機過程和統(tǒng)計推斷的知識主線進行講解,結(jié)合數(shù)學的本質(zhì)內(nèi)涵,用淺顯易懂的語言講透深刻的數(shù)學思想,幫助讀者構(gòu)建理論體系。同時,作者在講解的過程中注重應用場景的延伸,并利用Python工具無縫對接工程應用,幫助讀者學以致用。
?全書共5章。
?第1章以條件概率和獨立性作為切入點,幫助讀者建立認知概率世界的正確視角。
?第2章介紹隨機變量的基礎(chǔ)概念和重要分布類型,并探討多元隨機變量間的重要關(guān)系。
?第3章介紹極限思維以及蒙特卡羅方法,并重點分析極大似然估計方法以及有偏無偏等重要性質(zhì),*后拓展到含有隱變量的參數(shù)估計問題,介紹EM算法的原理及其應用。
?第4章由靜態(tài)的隨機變量過渡到動態(tài)的隨機過程,重點介紹馬爾可夫過程和隱馬爾可夫模型。
?第5章聚焦馬爾可夫鏈-蒙特卡羅方法,并列舉實例展示Metropolis-Hastings和Gibbs的具體采樣過程。
序
前言
第1章 概率思想:構(gòu)建理論基礎(chǔ)1
1.1 理論基石:條件概率、獨立性與貝葉斯1
1.1.1 從概率到條件概率1
1.1.2 條件概率的具體描述2
1.1.3 條件概率的表達式分析3
1.1.4 兩個事件的獨立性4
1.1.5 從條件概率到全概率公式5
1.1.6 聚焦貝葉斯公式6
1.1.7 本質(zhì)內(nèi)涵:由因到果,由果推因7
1.2 事件的關(guān)系:深入理解獨立性8
1.2.1 重新梳理兩個事件的獨立性8
1.2.2 不相容與獨立性8
1.2.3 條件獨立9
1.2.4 獨立與條件獨立11
1.2.5 獨立重復實驗11
第2章 變量分布:描述隨機世界13
2.1 離散型隨機變量:分布與數(shù)字特征13
2.1.1 從事件到隨機變量13
2.1.2 離散型隨機變量及其要素14
2.1.3 離散型隨機變量的分布列15
2.1.4 分布列和概率質(zhì)量函數(shù)16
2.1.5 二項分布及二項隨機變量17
2.1.6 幾何分布及幾何隨機變量21
2.1.7 泊松分布及泊松隨機變量24
2.2 連續(xù)型隨機變量:分布與數(shù)字特征27
2.2.1 概率密度函數(shù)27
2.2.2 連續(xù)型隨機變量區(qū)間概率的計算29
2.2.3 連續(xù)型隨機變量的期望與方差29
2.2.4 正態(tài)分布及正態(tài)隨機變量30
2.2.5 指數(shù)分布及指數(shù)隨機變量33
2.2.6 均勻分布及其隨機變量35
2.3 多元隨機變量(上):聯(lián)合、邊緣與條件38
2.3.1 實驗中引入多個隨機變量38
2.3.2 聯(lián)合分布列38
2.3.3 邊緣分布列39
2.3.4 條件分布列40
2.3.5 集中梳理核心的概率理論44
2.4 多元隨機變量(下):獨立與相關(guān)46
2.4.1 隨機變量與事件的獨立性46
2.4.2 隨機變量之間的獨立性47
2.4.3 獨立性示例48
2.4.4 條件獨立的概念48
2.4.5 獨立隨機變量的期望和方差50
2.4.6 隨機變量的相關(guān)性分析及量化方法52
2.4.7 協(xié)方差及協(xié)方差矩陣52
2.4.8 相關(guān)系數(shù)的概念54
2.5 多元隨機變量實踐:聚焦多元正態(tài)分布55
2.5.1 再談相關(guān)性:基于二元標準正態(tài)分布55
2.5.2 二元一般正態(tài)分布57
2.5.3 聚焦相關(guān)系數(shù)60
2.5.4 獨立和相關(guān)性的關(guān)系64
2.6 多元高斯分布:參數(shù)特征和幾何意義66
2.6.1 從一元分布到多元分布66
2.6.2 多元高斯分布的參數(shù)形式67
2.6.3 二元高斯分布的具體示例68
2.6.4 多元高斯分布的幾何特征71
2.6.5 二元高斯分布幾何特征實例分析74
第3章 參數(shù)估計:探尋最大可能77
3.1 極限思維:大數(shù)定律與中心極限定理77
3.1.1 一個背景話題77
3.1.2 大數(shù)定律78
3.1.3 大數(shù)定律的模擬80
3.1.4 中心極限定理83
3.1.5 中心極限定理的工程意義84
3.1.6 中心極限定理的模擬85
3.1.7 大數(shù)定律的應用:蒙特卡羅方法86
3.2 推斷未知:統(tǒng)計推斷的基本框架89
3.2.1 進入統(tǒng)計學89
3.2.2 統(tǒng)計推斷的例子90
3.2.3 統(tǒng)計推斷中的一些重要概念91
3.2.4 估計量的偏差與無偏估計92
3.2.5 總體均值的估計93
3.2.6 總體方差的估計95
3.3 極大似然估計100
3.3.1 極大似然估計法的引例100
3.3.2 似然函數(shù)的由來102
3.3.3 極大似然估計的思想103
3.3.4 極大似然估計值的計算105
3.3.5 簡單極大似然估計案例106
3.3.6 高斯分布參數(shù)的極大似然估計107
3.4 含有隱變量的參數(shù)估計問題110
3.4.1 參數(shù)估計問題的回顧110
3.4.2 新情況:場景中含有隱變量111
3.4.3 迭代法:解決含有隱變量情形的拋硬幣問題112
3.4.4 代碼實驗115
3.5 概率漸增:EM算法的合理性118
3.5.1 EM算法的背景介紹119
3.5.2 先拋出EM算法的迭代公式119
3.5.3 EM算法為什么是有效的120
3.6 探索EM公式的底層邏輯與由來123
3.6.1 EM公式中的E步和M步124
3.6.2 剖析EM算法的由來124
3.7 探索高斯混合模型:EM 迭代實踐127
3.7.1 高斯混合模型的引入128
3.7.2 從混合模型的角度看內(nèi)部機理129
3.7.3 高斯混合模型的參數(shù)估計131
3.8 高斯混合模型的參數(shù)求解132
3.8.1 利用 EM 迭代模型參數(shù)的思路132
3.8.2 參數(shù)估計示例136
3.8.3 高斯混合模型的應用場景139
第4章 隨機過程:聚焦動態(tài)特征145
4.1 由靜向動:隨機過程導引145
4.1.1 隨機過程場景舉例1:博彩146
4.1.2 隨機過程場景舉例2:股價的變化150
4.1.3 隨機過程場景舉例3:股價變化過程的展現(xiàn)152
4.1.4 兩類重要的隨機過程概述154
4.2 狀態(tài)轉(zhuǎn)移:初識馬爾可夫鏈155
4.2.1 馬爾可夫鏈三要素155
4.2.2 馬爾可夫性:靈魂特征156
4.2.3 轉(zhuǎn)移概率和狀態(tài)轉(zhuǎn)移矩陣157
4.2.4 馬爾可夫鏈性質(zhì)的總結(jié)158
4.2.5 一步到達與多步轉(zhuǎn)移的含義159
4.2.6 多步轉(zhuǎn)移與矩陣乘法160
4.2.7 路徑概率問題163
4.3 變與不變:馬爾可夫鏈的極限與穩(wěn)態(tài)164
4.3.1 極限與初始狀態(tài)無關(guān)的情況164
4.3.2 極限依賴于初始狀態(tài)的情況165
4.3.3 吸收態(tài)與收斂分析167
4.3.4 可達與常返168
4.3.5 周期性問題171
4.3.6 馬爾可夫鏈的穩(wěn)態(tài)分析和判定172
4.3.7 穩(wěn)態(tài)的求法174
4.4 隱馬爾可夫模型:明暗兩條線176
4.4.1 從馬爾可夫鏈到隱馬爾可夫模型176
4.4.2 典型實例1:盒子摸球?qū)嶒?77
4.4.3 典型實例2:小寶寶的日常生活180
4.4.4 隱馬爾可夫模型的外在表征181
4.4.5 推動模型運行的內(nèi)核三要素182
4.4.6 關(guān)鍵性質(zhì):齊次馬爾可夫性和觀測獨立性183
4.5 概率估計:隱馬爾可夫模型觀測序列描述183
4.5.1 隱馬爾可夫模型的研究內(nèi)容183
4.5.2 模型研究問題的描述185
4.5.3 一個直觀的思路186
4.5.4 更優(yōu)的方法:前向概率算法187
4.5.5 概率估計實踐190
4.5.6 代碼實踐192
4.6 狀態(tài)解碼:隱馬爾可夫模型隱狀態(tài)揭秘194
4.6.1 隱狀態(tài)解碼問題的描述194
4.6.2 最大路徑概率與維特比算法195
4.6.3 應用維特比算法進行解碼197
4.6.4 維特比算法的案例實踐199
4.6.5 代碼實踐202
4.7 連續(xù)域上的無限維:高斯過程204
4.7.1 高斯過程的一個實際例子205
4.7.2 高斯過程的核心要素和嚴謹描述206
4.7.3 徑向基函數(shù)的代碼演示207
4.7.4 高斯過程回歸原理詳解208
4.7.5 高斯過程回歸代碼演示210
第5章 統(tǒng)計推斷:貫穿近似策略215
5.1 統(tǒng)計推斷的基本思想和分類215
5.1.1 統(tǒng)計推斷的根源和場景215
5.1.2 后驗分布:推斷過程的關(guān)注重點216
5.1.3 精確推斷和近似推斷216
5.1.4 確定性近似:變分推斷概述217
5.2 隨機近似方法219
5.2.1 蒙特卡羅方法的理論支撐219
5.2.2 隨機近似的核心:蒙特卡羅220
5.2.3 接受-拒絕采樣的問題背景221
5.2.4 接受-拒絕采樣的方法和步驟221
5.2.5 接受-拒絕采樣的實踐222
5.2.6 接受-拒絕采樣方法背后的內(nèi)涵挖掘225
5.2.7 重要性采樣226
5.2.8 兩種采樣方法的問題及思考227
5.3 采樣絕佳途徑:借助馬爾可夫鏈的穩(wěn)態(tài)性質(zhì)228
5.3.1 馬爾可夫鏈回顧228
5.3.2 核心:馬爾可夫鏈的平穩(wěn)分布229
5.3.3 馬爾可夫鏈進入穩(wěn)態(tài)的轉(zhuǎn)移過程231
5.3.4 穩(wěn)態(tài)及轉(zhuǎn)移過程演示231
5.3.5 馬爾可夫鏈穩(wěn)態(tài)的價值和意義235
5.3.6 基于馬爾可夫鏈進行采樣的原理分析236
5.3.7 采樣過程實踐與分析238
5.3.8 一個顯而易見的問題和難點242
5.4 馬爾可夫鏈-蒙特卡羅方法詳解242
5.4.1 穩(wěn)態(tài)判定:細致平穩(wěn)條件243
5.4.2 Metropolis-Hastings采樣方法的原理244
5.4.3 如何理解隨機游走疊加接受概率245
5.4.4 如何實現(xiàn)隨機游走疊加接受概率247
5.4.5 建議轉(zhuǎn)移概率矩陣Q的設(shè)計247
5.4.6 Metropolis-Hastings方法的步驟和代碼演示251
5.5 Gibbs采樣方法簡介253
5.5.1 Gibbs方法核心流程253
5.5.2 Gibbs采樣的合理性255
5.5.3 Gibbs采樣代碼實驗256