本書貫穿了信號(hào)的獲取、處理、分析和識(shí)別整條鏈路所需的關(guān)鍵知識(shí)點(diǎn),以聲信號(hào)為研究對(duì)象,闡述了傳統(tǒng)信號(hào)處理、自適應(yīng)信號(hào)處理、機(jī)器學(xué)習(xí)等信號(hào)處理和智能分析設(shè)計(jì)等知識(shí)要點(diǎn)。全書總共16 章,第1~4 章介紹了經(jīng) 典信號(hào)處理與分析方法,第5~11 章闡述了先進(jìn)信號(hào)處理方法、人工特征的獲取原理和方法,第12~16 章主要說明了深度學(xué)習(xí)、混合模型等智能分析方法。
本書的主要讀者對(duì)象為聲信號(hào)處理和分析相關(guān)學(xué)科的高校學(xué)生,以及從事聲信號(hào)處理的相關(guān)科研工作者。本書對(duì)語音信號(hào)處理相關(guān)專業(yè)的技術(shù)人員也有一定的參考價(jià)值。本書也適合對(duì)智能語音信號(hào)分析感興趣的讀者閱讀。
內(nèi)容豐富
本書包括信號(hào)采集、處理、分析、識(shí)別整條鏈路的關(guān)鍵知識(shí)點(diǎn)。
知識(shí)系統(tǒng)
本書可幫助從事信號(hào)處理相關(guān)研究的科研人員系統(tǒng)地學(xué)習(xí)機(jī)器、算法、模型學(xué)習(xí)相關(guān)知識(shí)。
表述新穎
智能分析智能信號(hào)處理,人工智能類的書籍偏重機(jī)器學(xué)習(xí)方法,但沒有具體的研究對(duì)象。本書概括性地以公式為載體,講述了信號(hào)的獲取、處理、分析等關(guān)鍵知識(shí)點(diǎn)。
綜合性強(qiáng)
考慮到本科生和研究生的接受能力,筆者已經(jīng)在所在院校開展了相關(guān)知識(shí)點(diǎn)的教授,從教授效果來看,學(xué)生很喜歡這門課,基本都能夠掌握關(guān)鍵的知識(shí)點(diǎn),對(duì)數(shù)理分析、公式的來龍去脈,以及綜合應(yīng)用有詳細(xì)論述,讀者可把握知識(shí)框架和綜合應(yīng)用。
潘超
博士,現(xiàn)任西北工業(yè)大學(xué)副教授,主要從事信號(hào)信息處理領(lǐng)域的教學(xué)與麥克風(fēng)陣列信號(hào)處理、寬帶波束形成、語音增強(qiáng)、聲源分離、聲事件檢測(cè)、聲源定位、聲場(chǎng)測(cè)量、聲場(chǎng)重構(gòu)等方面的研發(fā)工作。
陳景東
博士,電氣電子工程師學(xué)會(huì)會(huì)士(IEEE Fellow),先后在日本國際電氣通信基礎(chǔ)技術(shù)研究所、澳大利亞格里菲斯大學(xué)、美國貝爾實(shí)驗(yàn)室等機(jī)構(gòu)任職,F(xiàn)任西北工業(yè)大學(xué)教授,主要從事聲信號(hào)處理、陣列信號(hào)處理、自適應(yīng)信號(hào)處理、模式識(shí)別,以及無線通信領(lǐng)域的研發(fā)工作。
第 1 章 信號(hào)與系統(tǒng) 1
1.1 信號(hào)的表述與分析. 1
1.2 離散處理 . 2
1.3 卷積 2
1.3.1 連續(xù)卷積 . 2
1.3.2 離散卷積 . 3
1.3.3 卷積的重要性質(zhì). 3
1.4 系統(tǒng)的描述 3
1.4.1 物理系統(tǒng) . 4
1.4.2 濾波系統(tǒng) . 4
1.5 抽樣定理 . 4
1.5.1 抽樣的基本準(zhǔn)則. 4
1.5.2 工具①:連續(xù)時(shí)間脈沖串函數(shù)及其傅里葉變換 4
1.5.3 工具②:卷積操作下傅里葉變換的性質(zhì) 5
1.5.4 推導(dǎo):抽樣定理. 6
1.5.5 混疊案例:高頻的信號(hào)表現(xiàn)出低頻的行為. 7
1.6 問題 7
第 2 章 離散傅里葉變換. 9
2.1 離散信號(hào)的傅里葉變換 9
2.1.1 離散時(shí)間傅里葉變換 . 9
2.1.2 大致思路 . 9
2.1.3 從時(shí)間上離散的信號(hào)到時(shí)間上連續(xù)的信號(hào). 10
2.1.4 脈沖串調(diào)制后信號(hào)的傅里葉變換 10
2.1.5 離散時(shí)間傅里葉變換 . 10
2.1.6 正交性與反離散時(shí)間傅里葉變換 11
2.2 DTFT 的重要性質(zhì) 11
2.2.1 線性性質(zhì) . 12
2.2.2 時(shí)移性質(zhì) . 12
2.2.3 頻移性質(zhì) . 12
2.2.4 時(shí)域卷積定理 . 12
2.2.5 頻域卷積定理 . 13
2.3 離散傅里葉變換 13
2.3.1 DFT 的定義 13
2.3.2 基函數(shù)的正交性. 14
2.3.3 DFT 的反變換 . 14
2.3.4 簡(jiǎn)要總結(jié) . 15
2.4 DFT 簡(jiǎn)潔描述. 15
2.5 DFT 的性質(zhì) 16
2.5.1 工具①:周期延拓序列與主值序列 . 16
2.5.2 線性性質(zhì) . 17
2.5.3 時(shí)域循環(huán)移位定理 18
2.5.4 頻域循環(huán)移位定理 18
2.5.5 循環(huán)卷積定理 . 19
2.6 問題 19
第 3 章 Z 變換 . 21
3.1 Z 變換的定義. 21
3.1.1 Z 變換的定義 . 21
3.1.2 正交性 21
3.1.3 反 Z 變換 22
3.2 Z 變換收斂域. 22
3.2.1 有限長序列的收斂域 . 23
3.2.2 右序列的收斂域. 23
3.2.3 左序列的收斂域. 24
3.2.4 雙邊序列的收斂域 24
3.2.5 序列類型與收斂域的總結(jié) 25
3.3 Z 變換的性質(zhì). 26
3.3.1 線性性質(zhì) . 26
3.3.2 時(shí)域卷積定理 . 26
3.3.3 序列移位性質(zhì) . 27
3.3.4 序列乘以指數(shù)序列的性質(zhì) 27
3.3.5 序列乘以 的性質(zhì) 27
3.4 用 Z 變換描述和分析系統(tǒng) 28
3.4.1 零狀態(tài)響應(yīng) 28
3.4.2 系統(tǒng)全響應(yīng) 29
3.4.3 系統(tǒng)的頻率響應(yīng). 29
3.4.4 系統(tǒng)的因果性分析 30
3.4.5 系統(tǒng)的穩(wěn)定性分析 30
3.4.6 特殊系統(tǒng) . 30
3.5 問題 31
第 4 章 頻響濾波器的設(shè)計(jì) . 32
4.1 基本濾波框架. 32
4.1.1 IIR 濾波器 32
4.1.2 FIR 濾波器. 33
4.2 變換域下的濾波系統(tǒng) . 33
4.2.1 Z 域下的濾波系統(tǒng) 33
4.2.2 頻域下的濾波系統(tǒng) 33
4.3 濾波原理 . 34
4.4 IIR 濾波器的設(shè)計(jì) 34
4.4.1 沖激響應(yīng)不變法. 35
4.4.2 雙線性變換法 . 36
4.5 線性相位 FIR 濾波器 . 36
4.5.1 為什么要做線性相位 . 36
4.5.2 系統(tǒng)的時(shí)延量 . 37
4.5.3 利用對(duì)稱性約束線性相位 37
4.5.4 偶對(duì)稱、偶數(shù)長度濾波器 37
4.5.5 偶對(duì)稱、奇數(shù)長度濾波器 38
4.5.6 奇對(duì)稱、偶數(shù)長度濾波器 38
4.5.7 奇對(duì)稱、奇數(shù)長度濾波器 39
4.6 兩種 FIR 濾波器的設(shè)計(jì)方法 39
4.6.1 頻率采樣法 40
4.6.2 最優(yōu)逼近法 41
4.7 問題 42
第 5 章 自適應(yīng)濾波器的設(shè)計(jì) 43
5.1 信號(hào)模型與濾波 43
5.2 誤差與誤差統(tǒng)計(jì)量. 44
5.3 維納濾波器 44
5.3.1 自相關(guān)矩陣 Ryy . 45
5.3.2 互相關(guān)向量 ry 45
5.3.3 維納濾波器 46
5.4 維納濾波分析. 46
5.4.1 正交分解 . 46
5.4.2 輸出信噪比 47
5.4.3 信號(hào)畸變 . 48
5.5 卡爾曼濾波 49
5.5.1 狀態(tài)方程與觀測(cè)方程 . 49
5.5.2 濾波框架 . 49
5.5.3 雙誤差函數(shù) 50
5.5.4 最優(yōu)濾波器 50
5.6 問題 51
第 6 章 信道 . 52
6.1 信道建模 . 52
6.2 信道的可變性. 53
6.2.1 鏡像源模型 53
6.2.2 隨房間大小的變化 55
6.2.3 隨墻面材質(zhì)變化. 55
6.2.4 隨空間位置變化. 56
6.2.5 隨周圍環(huán)境變化. 56
6.3 信道的頻率選擇性. 56
6.3.1 單信道的頻率選擇性 . 56
6.3.2 多信道的共零點(diǎn)特性 . 57
6.4 信道均衡 . 57
6.5 噪聲對(duì)消 . 58
6.6 問題 59
第 7 章 信道估計(jì) 60
7.1 信號(hào)模型 . 60
7.1.1 代價(jià)函數(shù) . 61
7.1.2 最速梯度下降算法 61
7.2 LMS 算法與 NLMS 算法 63
7.2.1 LMS 算法 63
7.2.2 收斂性分析 64
7.2.3 NLMS 算法 64
7.3 變換域信道估計(jì)方法 . 65
7.3.1 信號(hào)模型 . 65
7.3.2 代價(jià)函數(shù) . 67
7.3.3 兩個(gè)關(guān)鍵的梯度函數(shù) . 67
7.3.4 梯度計(jì)算與信道更新 . 68
7.3.5 Hessian 矩陣求逆的簡(jiǎn)化 69
7.4 問題 69
第 8 章 陣列信號(hào)處理 70
8.1 波束形成框架. 70
8.2 空間響應(yīng) . 71
8.3 指向性因子和白噪聲增益 . 72
8.3.1 指向性因子 72
8.3.2 白噪聲增益 73
8.3.3 信噪比增益 73
8.4 波束形成器設(shè)計(jì) 75
8.4.1 延遲求和波束形成 75
8.4.2 超指向波束形成. 75
8.4.3 差分波束形成 . 76
8.4.4 正交級(jí)數(shù)展開波束形成. 78
8.4.5 自適應(yīng)波束形成. 80
8.5 問題 81
第 9 章 語音信號(hào) 82
9.1 語音信號(hào)的產(chǎn)生機(jī)理 . 82
9.2 脈沖串模型與信號(hào)的基本特征. 83
9.3 自回歸模型 84
9.4 自回歸模型的求解. 84
9.5 問題 88
第 10 章 時(shí)頻域信號(hào)分析. 89
10.1 信號(hào)分幀處理 89
10.2 PR 條件 90
10.3 典型的窗函數(shù) 91
10.4 問題 . 94
第 11 章 MFCC 特征 95
11.1 人耳的聽覺機(jī)理 . 95
11.2 濾波器組. 96
11.2.1 1 倍頻程 96
3
11.2.2 梅爾頻率 96
11.2.3 等效矩形帶寬 97
11.2.4 伽馬通(Gammatone)濾波器組 . 97
11.3 線性加權(quán)與梅爾譜 99
11.4 譜包絡(luò)與倒譜 100
11.5 梅爾頻率倒譜系數(shù)(MFCC).101
11.6 問題 .102
第 12 章 GMM 模型和 EM 算法103
12.1 從貝葉斯到混合模型.103
12.2 GMM 模型 104
12.3 EM 算法 .105
12.3.1 多個(gè)觀測(cè)聯(lián)合估計(jì) .106
12.3.2 離散隱變量的估計(jì) .106
12.4 GMM-EM 算法 .107
12.4.1 GMM 模型下迭代公式的化簡(jiǎn)107
12.4.2 混合系數(shù) 的迭代估計(jì) 107
12.4.3 均值的迭代估計(jì)108
12.4.4 方差的迭代估計(jì)108
12.5 應(yīng)用:說話人識(shí)別 109
12.5.1 說話人聲學(xué)特征109
12.5.2 說話人識(shí)別的基本框架109
12.5.3 參數(shù)學(xué)習(xí) 110
12.6 問題 .111
第 13 章 深度神經(jīng)網(wǎng)絡(luò)與反向傳播 112
13.1 神經(jīng)網(wǎng)絡(luò).112
13.1.1 神經(jīng)元.112
13.1.2 神經(jīng)網(wǎng)絡(luò)的建模能力 113
13.1.3 深度前饋神經(jīng)網(wǎng)絡(luò) .113
13.2 網(wǎng)絡(luò)結(jié)構(gòu).114
13.2.1 卷積網(wǎng)絡(luò) 114
13.2.2 殘差網(wǎng)絡(luò) 115
13.2.3 循環(huán)神經(jīng)網(wǎng)絡(luò) 116
13.2.4 注意力機(jī)制網(wǎng)絡(luò)117
13.3 代價(jià)函數(shù).117
13.3.1 均方誤差 117
13.3.2 交叉熵.118
13.3.3 負(fù)對(duì)數(shù)似然 .118
13.4 反向傳播方法 118
13.4.1 參數(shù)更新的基本原理 118
13.4.2 導(dǎo)數(shù)的鏈?zhǔn)椒▌t119
13.4.3 反向傳播 119
13.4.4 非頂層參數(shù)更新121
13.4.5 頂層參數(shù)更新 121
13.5 問題 .122
第 14 章 分類、聚類和降維 .123
14.1 距離與相似度 123
14.1.1 樣本之間的距離123
14.1.2 分布之間的距離123
14.1.3 相似度.124
14.2 分類 .124
14.2.1 K 近鄰算法124
14.2.2 樸素貝葉斯 .125
14.2.3 Logistic 二分類回歸與 Softmax 多分類回歸 .126
14.2.4 深度學(xué)習(xí) 128
14.3 有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí) 128
14.3.1 有監(jiān)督學(xué)習(xí) .128
14.3.2 無監(jiān)督學(xué)習(xí) .128
14.4 聚類 .129
14.4.1 K 均值聚類129
14.4.2 密度峰值聚類 129
14.4.3 層級(jí)聚類 130
14.5 降維 .131
14.6 問題 .132
第 15 章 支持向量機(jī) 133
15.1 決策函數(shù)與優(yōu)化問題.133
15.1.1 決策函數(shù) 133
15.1.2 設(shè)計(jì)準(zhǔn)則 134
15.1.3 優(yōu)化問題 134
15.1.4 拉格朗日函數(shù)與 KKT 條件 134
15.1.5 對(duì)偶優(yōu)化問題 136
15.2 穩(wěn)健 SVM .136
15.3 Relu 函數(shù)與 SVM .139
15.4 核函數(shù) SVM 140
15.5 SVM 問題的求解141
15.6 問題 .143
第 16 章 聲紋特征提取與說話人識(shí)別.144
16.1 聲紋識(shí)別的基本框架.144
16.1.1 模型構(gòu)建的基本思路 145
16.1.2 說話人注冊(cè)的基本過程145
16.1.3 說話人辨識(shí)的基本過程146
16.2 聲紋提取模型的構(gòu)建與訓(xùn)練 .147
16.2.1 幀級(jí)別特征提取147
16.2.2 片段級(jí)別特征提取 .148
16.3 問題 .149
附錄 A .150
A.1 傅里葉變換對(duì).150
A.2 離散時(shí)間傅里葉變換對(duì) 151
A.3 拉普拉斯變換對(duì)151
A.4 Z 變換對(duì) .152
A.5 點(diǎn)到超平面的距離.153
附錄 B 符號(hào)與運(yùn)算符說明155
B.1 符號(hào)說明 .155
B.2 運(yùn)算符說明 155
參考文獻(xiàn)157