本書系統(tǒng)地闡述了語音信號處理的原理、方法、技術(shù)和應用,同時給出了部分內(nèi)容對應的MATLAB仿真源程序。全書共14章,第1~6章是基本理論部分,包括語音信號的數(shù)字模型、語音信號的短時時域分析、頻域分析及倒譜分析、語音信號線性預測分析和矢量量化;第7~14章是應用部分,包括語音編碼、語音合成、語音識別、語音增強、小波分析、人工神經(jīng)網(wǎng)絡及獨立分量分析及其在語音信號處理中的應用、語音質(zhì)量評價和可懂度評價原理及實現(xiàn)。 本書內(nèi)容全面,重點突出,原理闡述深入淺出,注重理論與實際應用的結(jié)合,可讀性強。 本書可以作為高等院校通信工程、電子信息工程、自動化、計算機技術(shù)與應用等專業(yè)高年級本科生相關(guān)課程的教材,也可供從事語音信號處理研究的研究生和科研人員參考。
第1章 緒論
1.1 語音信號處理的發(fā)展
1.1.1 語音合成
1.1.2 語音編碼
1.1.3 語音識別
1.2 語音信號處理的應用
1.3 語音信號處理的過程
1.4 MATLAB在數(shù)字語音信號處理中的應用
習題1
第2章 語音信號的數(shù)字模型
2.1 語音的發(fā)聲機理
2.1.1 人的發(fā)聲器官
2.1.2 語音生成
2.2 語音的聽覺機理
2.2.1 聽覺器官
2.2.2 聽覺掩蔽效應
2.2.3 臨界帶寬與頻率群
2.2.4 耳蝸的信號處理機制
2.2.5 語音信號聽覺模型
2.3 語音信號的線性模型
2.3.1 激勵模型
2.3.2 聲道模型
2.3.3 輻射模型
2.3.4 語音信號數(shù)字模型
2.4 語音信號的非線性模型
2.4.1 線性模型局限性
2.4.2 幾種非線性模型
2.4.3 非線性動力學模型
2.4.4 非線性模型在語音信號處理中的應用及MATLAB實現(xiàn)
習題2
第3章 語音信號的短時時域分析
3.1 語音信號的預處理
3.1.1 語音信號的預加重處理
3.1.2 語音信號的加窗處理
3.2 短時平均能量
3.3 短時平均幅度函數(shù)
3.4 短時平均過零率
3.5 短時自相關(guān)分析
3.5.1 短時自相關(guān)函數(shù)
3.5.2 語音信號的短時自相關(guān)函數(shù)
3.5.3 修正的短時自相關(guān)函數(shù)
3.5.4 短時平均幅度差函數(shù)
3.6 基于能量和過零率的語音端點檢測
3.7 基音周期估值
3.7.1 基于短時自相關(guān)法的基音周期估值
3.7.2 基于短時平均幅度差 函數(shù)AMDF法的基音周期估值
3.7.3 基音周期估值的后處理
3.7.4 基音周期估值后處理的MATLAB實現(xiàn)
習題3
第4章 語音信號短時頻域及倒譜分析
4.1 傅里葉變換的解釋
4.1.1 短時傅里葉變換
4.1.2 窗函數(shù)的作用
4.2 濾波器的解釋
4.2.1 短時傅里葉變換的濾波器實現(xiàn)形式一
4.2.2 短時傅里葉變換的濾波器 實現(xiàn)形式二
4.3 短時綜合的濾波器組相加法
4.3.1 短時綜合的濾波器組相加法原理
4.3.2 短時綜合的濾波器組相加法的MATLAB程序?qū)崿F(xiàn)
4.3.3 短時綜合的疊接相加法原理及MATLAB程序?qū)崿F(xiàn)
4.4 語音信號的復倒譜和倒譜分析及 應用
4.4.1 復倒譜和倒譜的定義及性質(zhì)
4.4.2 復倒譜的幾種計算方法
4.4.3 倒譜的MATLAB實現(xiàn)
4.4.4 語音的倒譜分析及應用
習題4
第5章 語音信號線性預測分析
5.1 LPC的基本原理
5.1.1 LPC的實現(xiàn)方法
5.1.2 語音信號模型和LPC 之間的關(guān)系
5.1.3 模型增益G的確定
5.2 線性預測分析的解法
5.2.1 自相關(guān)法
5.2.2 協(xié)方差法
5.2.3 自相關(guān)法的MATLAB 實現(xiàn)
5.3 線譜對LSP分析
5.3.1 LSP的定義和特點
5.3.2 LPC參數(shù)到LSP參數(shù)的轉(zhuǎn)換及MATLAB實現(xiàn)
5.3.3 LSP參數(shù)到LPC參數(shù)的轉(zhuǎn)換及MATLAB實現(xiàn)
5.4 LPC的幾種推演參數(shù)
5.4.1 反射系數(shù)
5.4.2 對數(shù)面積比系數(shù)LAR
5.4.3 預測器多項式的根
5.4.4 預測誤差濾波器的沖激 響應及其自相關(guān)系數(shù)
5.4.5 LPC倒譜及其MATLAB實現(xiàn)
習題5
第6章 矢量量化
6.1 矢量量化基本原理
6.1.1 矢量量化的定義
6.1.2 失真測度
6.1.3 矢量量化器
6.2 最佳矢量量化器
6.3 矢量量化器的設計算法及MATLAB實現(xiàn)
6.3.1 LBG算法
6.3.2 初始碼書的選定與空胞腔的處理
6.3.3 已知訓練序列的LBG算法的MATLAB實現(xiàn)
6.3.4 樹形搜索矢量量化器
習題6
第7章 語音編碼原理及應用
7.1 語音編碼的分類及特性
7.1.1 波形編碼
7.1.2 參數(shù)編碼
7.1.3 混合編碼
7.2 語音編碼性能的評價指標
7.2.1 編碼速率
7.2.2 編碼語音質(zhì)量評價
7.2.3 編解碼延時
7.2.4 算法復雜度
7.3 語音信號波形編碼
7.3.1 脈沖編碼調(diào)制PCM
7.3.2 自適應預測編碼APC
7.3.3 G.721編碼及算法實現(xiàn)
7.4 語音信號參數(shù)編碼
7.4.1 LPC聲碼器原理
7.4.2 LPC?10編碼器
7.5 語音信號混合編碼
7.5.1 合成分析技術(shù)和感覺加權(quán)濾波器
7.5.2 激勵模型的演變
7.5.3 G.728語音編碼標準簡介
7.6 語音信號寬帶變速率編碼
習題7
第8章 語音合成
8.1 語音合成的原理及分類
8.1.1 波形合成法
8.1.2 參數(shù)合成法
8.1.3 規(guī)則合成法
8.2 共振峰合成法
8.2.1 級聯(lián)型共振峰模型
8.2.2 并聯(lián)型共振峰模型
8.2.3 混合型共振峰模型
8.3 線性預測參數(shù)合成法
8.4 基音同步疊加法
8.4.1 基音同步疊加PSOLA算法原理
8.4.2 基音同步疊加PSOLA算法實現(xiàn)步驟
8.5 文語轉(zhuǎn)換系統(tǒng)
8.5.1 文語轉(zhuǎn)換系統(tǒng)的組成
8.5.2 漢語按規(guī)則合成
習題8
第9章 語音識別基本原理與應用
9.1 語音識別系統(tǒng)概述
9.1.1 語音信號預處理
9.1.2 語音識別特征提取
9.1.3 語音訓練識別模型
9.2 HMM基本原理及在語音識別中的應用
9.2.1 隱馬爾可夫模型
9.2.2 隱馬爾可夫模型的3個基本問題
9.2.3 隱馬爾可夫模型用于語音識別
9.3 支持向量機在語音識別中的應用
9.3.1 支持向量機分類原理
9.3.2 支持向量機的模型參數(shù)選擇問題
9.3.3 支持向量機用于語音識別的MATLAB實現(xiàn)
習題9
第10章 語音增強原理及應用
10.1 語音和噪聲的主要特性
10.1.1 語音的主要特性
10.1.2 噪聲的特性
10.2 語音增強算法的分類
10.3 單通道語音增強算法及MATLAB仿真實現(xiàn)
10.3.1 譜減法
10.3.2 維納濾波法
10.3.3 最小均方誤差估計法
10.3.4 子空間語音增強算法
10.4 多通道語音增強算法及MATLAB 仿真實現(xiàn)
10.4.1 陣列信號系統(tǒng)模型
10.4.2 麥克風陣列近場模型與遠場模型
10.4.3 經(jīng)典麥克風陣列的語音增強算法
習題10
第11章 小波分析及在語音信號處理中的應用
11.1 基礎理論
11.2 小波的特性
11.2.1 連續(xù)小波變換及性質(zhì)
11.2.2 離散小波變換及性質(zhì)
11.3 幾種常用的小波及特性
11.3.1 Haar小波
11.3.2 Daubechies(dbN)小波
11.3.3 Mexican Hat(Marr) 小波
11.3.4 Morlet小波
11.3.5 Meyer小波
11.4 小波變換在語音信號處理中的應用
11.4.1 小波分析在語音信號預處理的應用及MATLAB實現(xiàn)
11.4.2 小波分析在語音去噪中的應用及MATLAB 實現(xiàn)
習題11
第12章 人工神經(jīng)網(wǎng)絡及在語音信號處理中的應用
12.1 人工神經(jīng)網(wǎng)絡簡介
12.2 人工神經(jīng)網(wǎng)絡構(gòu)成
12.2.1 神經(jīng)元
12.2.2 網(wǎng)絡拓撲
12.2.3 網(wǎng)絡的學習算法
12.3 幾種神經(jīng)網(wǎng)絡模型及其算法
12.3.1 單層感知器
12.3.2 多層感知器
12.3.3 徑向基函數(shù)神經(jīng)網(wǎng)絡
12.3.4 自組織特征映射神經(jīng)網(wǎng)絡
12.4 神經(jīng)網(wǎng)絡在語音信號處理中的應用
12.4.1 RBF神經(jīng)網(wǎng)絡在語音識別中的應用及MATLAB 實現(xiàn)
12.4.2 自組織神經(jīng)網(wǎng)絡在語音編碼中的應用及MATLAB 實現(xiàn)
習題12
第13章 獨立分量分析及在語音信號處理中的應用
13.1 基礎理論
13.1.1 ICA的定義與數(shù)學模型
13.1.2 ICA的基本假設、不確定性及求解過程
13.1.3 ICA中信號的預處理
13.1.4 ICA的目標函數(shù)
13.1.5 ICA性能評價參數(shù)
13.2 經(jīng)典ICA算法
13.2.1 自然梯度算法
13.2.2 信息最大化法
13.2.3 快速ICA算法 (FASTICA)
13.3 ICA在語音信號處理中的應用及MATLAB實現(xiàn)
13.3.1 INFORMAX算法在語音盲信號分離中的應用及MATLAB實現(xiàn)
13.3.2 FASTICA算法在語音盲信號分離中的應用及MATLAB實現(xiàn)
習題13
第14章 語音質(zhì)量評價和可懂度評價
14.1 語音質(zhì)量與可懂度
14.2 語音質(zhì)量的主觀評價方法
14.3 語音可懂度的主觀評價方法
14.4 語音質(zhì)量客觀評價方法
14.4.1 時域和頻域分段信噪比的方法及MATLAB 實現(xiàn)
14.4.2 基于LPC客觀評價方法及MATLAB實現(xiàn)
14.4.3 語音質(zhì)量的感知評價方法(PESQ)及MATLAB實現(xiàn)
14.5 語音可懂度客觀評價方法
14.5.1 加權(quán)頻帶信噪比評價方法及MATLAB實現(xiàn)
14.5.2 歸一化協(xié)方差評價方法(NCM)及MATLAB 實現(xiàn)
14.5.3 短時清晰度指數(shù)評價方法(AI-ST)及MATLAB實現(xiàn)
習題14
附錄A 專業(yè)術(shù)語縮寫英漢對照表
附錄B 程序索引
參考文獻