模式識別:數(shù)據(jù)質(zhì)量視角
定 價:79 元
叢書名:智能科學(xué)與技術(shù)叢書
- 作者:
- 出版時間:2020/3/1
- ISBN:9787111646754
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:O235
- 頁碼:0
- 紙張:
- 版次:
- 開本:16開
幾十年來,實際需求激發(fā)了對模式識別的大量理論和應(yīng)用研究。在這個過程中,限制因素和恒久問題一直是數(shù)據(jù)——它的多樣性、豐富性和可變質(zhì)量是模式識別創(chuàng)新的主要挑戰(zhàn)。本書關(guān)注高級數(shù)據(jù)分析和數(shù)據(jù)挖掘,創(chuàng)新之處是對數(shù)據(jù)質(zhì)量的重新定位——將數(shù)據(jù)質(zhì)量看作一個可以處理的因素,而非當(dāng)作需要克服的困難。
譯者序
前言
第一部分 基礎(chǔ)知識
第1章 模式識別:特征空間的構(gòu)建2
1.1 概念2
1.2 從樣本到特征5
1.2.1 向量型特征7
1.2.2 特征變換:從向量型到向量型8
1.2.3 特征變換:從向量型到數(shù)值型9
1.2.4 數(shù)值型特征10
1.3 特征尺度化12
1.3.1 特征歸一化13
1.3.2 標(biāo)準(zhǔn)化14
1.3.3 特征尺度的經(jīng)驗評價15
1.4 特征評估和選擇18
1.4.1 相關(guān)性18
1.4.2 特征評估:兩種方法20
1.4.3 基于指數(shù)的特征評估:單特征與特征集21
1.4.4 特征評估指數(shù)21
1.4.5 基于指數(shù)的方法和基于包裝的方法23
1.4.6 使用指數(shù)和分類器的單特征評估方案24
1.4.7 特征子集的選擇27
1.4.8 特征子集的生成29
1.5 結(jié)論37
附錄1.A38
附錄1.B40
參考文獻(xiàn)40
第2章 模式識別:分類器42
2.1 概念42
2.2 最近鄰分類方法43
2.3 支持向量機分類算法45
2.3.1 線性可分類的線性劃分46
2.3.2 線性不可分類的線性劃分48
2.3.3 線性不可分類的非線性劃分50
2.4 分類問題中的決策樹52
2.4.1 決策樹一覽52
2.4.2 特征分解57
2.4.3 度量類的差異性57
2.4.4 選擇一個分解特征60
2.4.5 限制樹的結(jié)構(gòu)61
2.5 集成分類器62
2.5.1 袋裝63
2.5.2 提升64
2.5.3 隨機森林65
2.6 貝葉斯分類器67
2.6.1 應(yīng)用貝葉斯理論67
2.6.2 最小化錯分概率68
2.6.3 最小化損失69
2.6.4 拒絕不確定樣本70
2.6.5 類條件概率分布71
2.7 結(jié)論79
參考文獻(xiàn)79
第3章 分類拒絕問題規(guī)范及概述82
3.1 概念82
3.2 拒絕架構(gòu)的概念87
3.3 基于原始樣本的拒絕91
3.3.1 構(gòu)建拒絕機制91
3.3.2 全局拒絕架構(gòu)下的拒絕機制92
3.3.3 局部拒絕架構(gòu)下的拒絕機制95
3.3.4 嵌入式拒絕架構(gòu)下的拒絕機制96
3.4 原始樣本數(shù)據(jù)集中的拒絕選項:案例研究97
3.4.1 數(shù)據(jù)集97
3.4.2 構(gòu)建一個樹形二值分類器100
3.4.3 針對手寫數(shù)字?jǐn)?shù)據(jù)集構(gòu)建一個樹形二值分類器101
3.4.4 針對手寫數(shù)字?jǐn)?shù)據(jù)集構(gòu)建一個帶拒絕的樹形二值分類器103
3.4.5 拒絕被錯分的原始樣本:一些想法105
3.5 結(jié)論106
參考文獻(xiàn)106
第4章 評估模式識別問題108
4.1 評估帶拒絕項的識別:基本概念108
4.1.1 評估拒絕的效率108
4.1.2 不平衡原始集與異類集109
4.1.3 度量拒絕質(zhì)量的有效性110
4.1.4 分離原始樣本和異類樣本111
4.1.5 對多類原始樣本的適應(yīng)112
4.1.6 評估帶拒絕項的多類分類問題113
4.1.7 說明性示例114
4.2 沒有異類樣本時帶拒絕的分類問題117
4.3 帶拒絕的分類:局部特征120
4.3.1 多類問題的特性描述120
4.3.2 說明性示例122
4.4 結(jié)論125
參考文獻(xiàn)126
第5章 帶拒絕的識別:經(jīng)驗分析127
5.1 實驗結(jié)果127
5.1.1 拒絕架構(gòu)的對比128
5.1.2 減少特征集數(shù)量131
5.1.3 分類器質(zhì)量與拒絕性能133
5.1.4 用于處理不平衡數(shù)據(jù)集的帶拒絕的分類137
5.2 幾何方法140
5.2.1 超矩形141
5.2.2 橢球體142
5.2.3 在幾何模型中限制為原始樣本保留的區(qū)域143
5.2.4 文獻(xiàn)評論153
5.3 結(jié)論155
參考文獻(xiàn)155
第二部分 高級主題:粒度計算框架
第6章 信息粒的概念158
6.1 信息粒度和粒度計算158
6.2 信息粒度的正式平臺161
6.3 區(qū)間和區(qū)間微積分164
6.4 模糊集微積分166
6.4.1 模糊集的隸屬函數(shù)和類167
6.4.2 三角范數(shù)和三角余模作為模糊集上運算的模型170
6.5 信息粒的特征:覆蓋率和特異性173
6.6 信息粒匹配176
6.7 結(jié)論177
參考文獻(xiàn)177
第7章 信息粒:基本構(gòu)造179
7.1 合理粒度原則179
7.1.1 一般觀察182
7.1.2 加權(quán)數(shù)據(jù)182
7.1.3 抑制性數(shù)據(jù)183
7.2 對設(shè)計有價值的信息粒度184
7.2.1 粒映射184
7.2.2 信息粒度分配協(xié)議187
7.2.3 粒度聚合:通過分配信息粒度增強聚合操作187
7.3 時間序列模型中暫存數(shù)據(jù)的單步和多步預(yù)測188
7.4 高級類型的粒模型的開發(fā)189
7.5 粒樣本的分類192
7.5.1 分類問題的公式化193
7.5.2 從數(shù)值數(shù)據(jù)到粒數(shù)據(jù)193
7.5.3 粒分類器:增強問題195
7.6 結(jié)論195
參考文獻(xiàn)196
第8章 聚類197
8.1 模糊c均值聚類方法197
8.2 k均值聚類算法201
8.3 帶有聚類和變量加權(quán)的增強模糊聚類201
8.4 基于知識的聚類202
8.5 聚類結(jié)果的質(zhì)量202
8.6 信息粒與聚類結(jié)果解釋204
8.6.1 數(shù)字原型的粒度描述符的形成204
8.6.2 數(shù)據(jù)粒度及其在FCM算法中的融合205
8.7 層次聚類205
8.8 隱私問題中的信息粒:微聚集的概念208
8.9 更高類型信息粒的開發(fā)208
8.10 實驗研究209
8.11 結(jié)論217
參考文獻(xiàn)218
第9章 數(shù)據(jù)質(zhì)量:填補和數(shù)據(jù)平衡219
9.1 數(shù)據(jù)填補:基本概念和關(guān)鍵問題219
9.2 填補方法的選定類別220
9.3 利用信息粒進(jìn)行填補221
9.4 基于合理粒度原則的顆粒填補222
9.5 基于模糊聚類的顆粒填補225
9.6 系統(tǒng)建模中的數(shù)據(jù)填補226
9.7 不平衡數(shù)據(jù)及其粒度特征227
9.7.1 數(shù)據(jù)平衡的主要方法:概述228
9.7.2 過采樣數(shù)據(jù)的粒度表示229
9.8 結(jié)論231
參考文獻(xiàn)231