數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)
定 價(jià):32 元
- 作者:李雄飛,董元方,李軍等編著
- 出版時(shí)間:2010/7/1
- ISBN:9787040304787
- 出 版 社:高等教育出版社
- 中圖法分類:TP311.13
- 頁(yè)碼:303
- 紙張:膠版紙
- 版次:2
- 開本:16K
數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)領(lǐng)域中的一些基本理論、研究方法和技術(shù)標(biāo)準(zhǔn),簡(jiǎn)單介紹了相關(guān)產(chǎn)品和工具,討論了KDD與數(shù)據(jù)挖掘的概念、數(shù)據(jù)挖掘?qū)ο、知識(shí)發(fā)現(xiàn)過(guò)程、研究方法以及相關(guān)的研究領(lǐng)域和應(yīng)用范圍。第2章~第9章詳細(xì)地介紹了關(guān)聯(lián)規(guī)則、聚類分析、決策樹、貝葉斯網(wǎng)絡(luò)、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、粗糙集、模糊集等數(shù)據(jù)挖掘模型與算法。第10章討論了模型選擇與模型評(píng)估方法。第11章和第12章簡(jiǎn)單介紹了數(shù)據(jù)預(yù)處理方法和數(shù)據(jù)挖掘技術(shù)標(biāo)準(zhǔn)、數(shù)據(jù)挖掘可視化技術(shù)和數(shù)據(jù)挖掘工具開發(fā)方法,并簡(jiǎn)單介紹了數(shù)據(jù)挖掘產(chǎn)品和工具。 《數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)(第2版)》可以作為計(jì)算機(jī)專業(yè)、信息類專業(yè)、管理類專業(yè)高年級(jí)本科生及研究生的教材或參考書,也可供有關(guān)人員學(xué)習(xí)參考。
第1章 緒論
1.1 引言
1.2 KDD與數(shù)據(jù)挖掘
1.2.1 KDD定義
1.2.2 KDD過(guò)程
1.2.3 數(shù)據(jù)庫(kù)技術(shù)發(fā)展與數(shù)據(jù)挖掘
1.3 數(shù)據(jù)挖掘的對(duì)象與環(huán)境
1.3.1 數(shù)據(jù)與系統(tǒng)特征
1.3.2 數(shù)據(jù)結(jié)構(gòu)
1.3.3 數(shù)據(jù)庫(kù)系統(tǒng)
1.4 數(shù)據(jù)挖掘方法與相關(guān)領(lǐng)域
1.4.1 數(shù)據(jù)挖掘相關(guān)領(lǐng)域
1.4.2 粗糙集
1.4.3 聚類
1.4.4 關(guān)聯(lián)規(guī)則
1.4.5 決策樹
1.4.6 模糊集
1.4.7 規(guī)則歸納
1.4.8 進(jìn)化計(jì)算
1.5 KDD系統(tǒng)與應(yīng)用
本章小結(jié)
習(xí)題1
第2章 關(guān)聯(lián)規(guī)則
2.1 引言
2.2 關(guān)聯(lián)規(guī)則基本模型
2.2.1 關(guān)聯(lián)規(guī)則基本模型
2.2.2 Apriori算法
2.2.3 LIG算法
2.2.4 FP算法
2.3 多級(jí)關(guān)聯(lián)規(guī)則與多維關(guān)聯(lián)規(guī)則
2.3.1 多級(jí)關(guān)聯(lián)規(guī)則
2.3.2 多維關(guān)聯(lián)規(guī)則
2.4 關(guān)聯(lián)規(guī)則價(jià)值衡量與發(fā)展
2.4.1 規(guī)則價(jià)值衡量
2.4.2 基于約束的關(guān)聯(lián)規(guī)則
2.4.3 關(guān)聯(lián)規(guī)則新進(jìn)展
本章小結(jié)
習(xí)題2
第3章 聚類分析
3.1 聚類分析簡(jiǎn)介
3.2 聚類分析中的數(shù)據(jù)類型
3.3 劃分方法
3.3.1 加均值算法
3.3.2 k-中心點(diǎn)算法
3.3.3 EM算法
3.4 層次方法
3.4.1 凝聚的和分裂的層次聚類
3.4.2 利用層次方法進(jìn)行平衡迭代歸約和聚類
3.4.3 利用代表點(diǎn)聚類
3.4.4 采用動(dòng)態(tài)建模技術(shù)的層次聚類算法
3.5 基于密度的方法
3.6 基于網(wǎng)格的方法
3.7 基于模型的聚類方法
3.8 孤立點(diǎn)分析
本章小結(jié)
習(xí)題3
第4章 決策樹
4.1 引言
4.2 信息論
4.2.1 信息傳輸與數(shù)據(jù)挖掘
4.2.2 信息論主要概念
4.3 ID3算法
4.4 決策樹的剪枝
4.4.1 預(yù)剪枝
4.4.2 后剪枝
4.4.3 決策樹的性能評(píng)價(jià)
4.5 決策樹算法的改進(jìn)
4.5.1 二叉樹決策算法
4.5.2 按增益比率估值的方法
4.5.3 按分類信息估值的方法
4.5.4 按劃分距離估值的方法
4.6 C4.5 算法
4.7 CART算法
4.8 SLIQ算法
4.9 決策樹與數(shù)據(jù)預(yù)處理
4.9.1 數(shù)據(jù)概化與約簡(jiǎn)
4.9.2 抽樣方法
4.9.3 維歸約及特征子集的選取
4.9.4 冗余特征子集刪除
4.9.5 離散化處理
4.9.6 改變數(shù)據(jù)結(jié)構(gòu)
4.10 算法改進(jìn)
4.10.1 多決策樹綜合技術(shù)
4.10.2 決策樹的增量學(xué)習(xí)
本章小結(jié)
習(xí)題4
第5章 貝葉斯網(wǎng)絡(luò)
5.1 貝葉斯網(wǎng)絡(luò)基本概念
5.2 不確定性推理與聯(lián)合概率分布
5.3貝葉斯網(wǎng)絡(luò)中的獨(dú)立關(guān)系
5.3.1 條件獨(dú)立
5.3.2 有向分離和條件獨(dú)立
5.3.3 因果影響?yīng)毩?/span>
5.3.4 環(huán)境獨(dú)立
5.4 貝葉斯網(wǎng)絡(luò)學(xué)習(xí)
5.4.1 結(jié)構(gòu)學(xué)習(xí)
5.4.2 搜索算法
5.4.3 基于約束的方法
5.4.4 參數(shù)學(xué)習(xí)
5.5 貝葉斯網(wǎng)絡(luò)分類器
5.5.1 樸素貝葉斯網(wǎng)絡(luò)分類器
5.5.2 半樸素貝葉斯分類器與選擇貝葉斯分類器
5.5.3 樹增廣樸素貝葉斯網(wǎng)絡(luò)分類器
5.5.4 廣義樸素貝葉斯網(wǎng)絡(luò)分類器
本章小結(jié)
習(xí)題5
第6章 人工神經(jīng)網(wǎng)絡(luò)
6.1 人工神經(jīng)元及人工神經(jīng)網(wǎng)絡(luò)模型
6.1.1 M.P模型
6.1.2 人工神經(jīng)元的形式化描述
6.1.3 神經(jīng)網(wǎng)絡(luò)的分類
6.1.4 人工神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方式
6.2 前向神經(jīng)網(wǎng)絡(luò)
6.2.1 感知器
6.2.2 多層前向神經(jīng)網(wǎng)絡(luò)的BP算法
6.2.3 徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)
6.3 反饋神經(jīng)網(wǎng)絡(luò)
6.3.1 前向神經(jīng)網(wǎng)絡(luò)與反饋神經(jīng)網(wǎng)絡(luò)的比較
6.3.2 反饋神經(jīng)網(wǎng)絡(luò)模型
6.3.3 離散型Hopfield神經(jīng)網(wǎng)絡(luò)
6.3.4 連續(xù)型Hopfield神經(jīng)網(wǎng)絡(luò)
6.3.5 Boltzmarm機(jī)
6.4 自組織競(jìng)爭(zhēng)神經(jīng)網(wǎng)絡(luò)模型
6.5 基于人工神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘
本章小結(jié)
習(xí)題6
第7章 支持向量機(jī)
7.1 學(xué)習(xí)機(jī)器泛化性能的界
7.1.1 VC維
7.1.2 Rn中有向超平面對(duì)點(diǎn)的打散
7.1.3 VC維和參數(shù)個(gè)數(shù)
7.1.4 通過(guò)最小化h最小化界
7.1.5 實(shí)例
7.1.6 結(jié)構(gòu)風(fēng)險(xiǎn)最小化
7.2 線性支持向量機(jī)
7.2.1 可分情形
7.2.2 Karush-Kuim-TUckei·條件
7.2.3 測(cè)試
7.2.4 非可分情形
7.3 非線性支持向量機(jī)
7.3.1 硬間隔非線性支持向量機(jī)
7.3.2 軟間隔非線性支持向量機(jī)
7.3.3 v-SVM分類器
7.3.4 處理不平衡數(shù)據(jù)的加權(quán)SVM
7.3.5 多類別SVM分類
7.3.6 Mercer。條件及Mercer定理
7.3.7 非線性支持向量機(jī)實(shí)例
7.4 支持向量機(jī)的VC維
7.5 支持向量機(jī)應(yīng)用
7.5.1 手寫體數(shù)字識(shí)別
7.5.2 文本分類
7.5.3 生物信息學(xué)中的SVM應(yīng)用
本章小結(jié)
習(xí)題7
第8章 粗糙集
8.1 近似空間
8.1.1 近似空間與不可分辨關(guān)系
8.1.2 知識(shí)與知識(shí)庫(kù)
8.2 近似與粗糙集
8.2.1 近似與粗糙集的基本概念
8.2.2 粗糙集的基本性質(zhì)
8.3 粗糙集的特征描述
8.3.1 近似精度
8.3.2 粗糙集隸屬函數(shù)
8.3.3 拓?fù)涮卣?/span>
8.4 知識(shí)約簡(jiǎn)
8.4.1 約簡(jiǎn)與核
8.4.2 相對(duì)約簡(jiǎn)和相對(duì)核
8.5 知識(shí)的依賴性
8.6 信息系統(tǒng)
8.6.1 信息系統(tǒng)的定義
8.6.2 分辨矩陣與分辨函數(shù)
8.7 決策表
8.8 決策規(guī)則
8.9 擴(kuò)展的粗糙集模型
8.9.1 可變精度粗糙集模型
8.9.2 相似模型
本章小結(jié)
習(xí)題8
第9章 模糊集
9.1 模糊集定義與隸屬函數(shù)
9.1.1 模糊集定義與隸屬函數(shù)
9.1.2 模糊集合的表示法
9.2 模糊集的基本運(yùn)算
9.3 分解定理與擴(kuò)展原理
9.4 模糊集的特征
9.5 模糊集的度量
9.5.1 模糊度
9.5.2 模糊集間的距離
9.5.3 模糊集的貼近度
9.6 模糊關(guān)系
9.6.1 模糊關(guān)系定義
9.6.2 模糊關(guān)系的運(yùn)算與性質(zhì)
9.6.3 模糊等價(jià)關(guān)系與模糊相似關(guān)系
9.7 模糊聚類分析
9.7.1 模糊劃分
9.7.2 模糊相似系數(shù)的標(biāo)定方法
9.7.3 模糊聚類分析
9.7.4 傳遞閉包法
9.7.5 最大樹法
9.7.6 模糊c-均值聚類
9.8 模糊集與粗糙集
本章小節(jié)
習(xí)題9
第10章 模型選擇與模型評(píng)估
10.1 模型的過(guò)擬合
10.2 沒有天生優(yōu)越的分類器
10.3 模型、模型選擇和模型評(píng)估
10.4 簡(jiǎn)單劃分和交叉驗(yàn)證
10.5 自助法
10.6 Occam剃刀
10.7 最小描述長(zhǎng)度準(zhǔn)則
10.8 信息準(zhǔn)則
10.8.1 Akaike信息準(zhǔn)則
10.8.2 Bayesian信息準(zhǔn)則
10.9 比較分類器的方法
10.9.1 估計(jì)準(zhǔn)確率的置信區(qū)間
10.9.2 比較兩個(gè)模型的性能
10.9.3 比較兩種分類法的性能
10.1 0聚類評(píng)估
10.1 0.1 假設(shè)檢驗(yàn)
10.1 0.2 聚類評(píng)估中的假設(shè)檢驗(yàn)
10.1 0.3 相對(duì)準(zhǔn)則
本章小結(jié)
習(xí)題10
第11章 數(shù)據(jù)預(yù)處理與可視化技術(shù)
11.1 數(shù)據(jù)清理
11.1.1 填補(bǔ)空缺值
11.1.2 消除噪聲數(shù)據(jù)
11.1.3 實(shí)現(xiàn)數(shù)據(jù)一致性
11.2 數(shù)據(jù)集成與轉(zhuǎn)換
11.2.1 數(shù)據(jù)集成
11.2.2 數(shù)據(jù)轉(zhuǎn)換
11.3 數(shù)據(jù)歸約與濃縮
11.3.1 數(shù)據(jù)立方體聚集
11.3.2 維歸約
11.3.3 數(shù)據(jù)壓縮
11.3.4 數(shù)值歸約
11.4 概念分層
11.4.1 概念分層的概念
11.4.2 概念分層的類型
11.4.3 數(shù)值數(shù)據(jù)的概念分層與離散化
11.4.4 分類數(shù)據(jù)的概念分層
11.5 可視化技術(shù)概述
11.5.1 可視化技術(shù)分類
11.5.2 可視化技術(shù)在數(shù)據(jù)挖掘中的應(yīng)用
11.6 過(guò)程可視化
11.7 數(shù)據(jù)可視化
11.7.1 折線圖
11.7.2 復(fù)合餅圖
11.7.3 散點(diǎn)圖
11.7.4 盒圖
11.7.5 平行坐標(biāo)法
11.7.6 圓環(huán)分段表示
11.8 結(jié)果可視化
11.8.1 關(guān)聯(lián)規(guī)則
11.8.2 分類
11.8.3 聚類
本章小結(jié)
習(xí)題11
第12章 數(shù)據(jù)挖掘工具與產(chǎn)品
12.1 數(shù)據(jù)挖掘標(biāo)準(zhǔn)
12.1.1 數(shù)據(jù)挖掘標(biāo)準(zhǔn)化概述
12.1.2 數(shù)據(jù)挖掘過(guò)程標(biāo)準(zhǔn)
12.1.3 數(shù)據(jù)挖掘接口標(biāo)準(zhǔn)
12.1.4 數(shù)據(jù)挖掘的語(yǔ)言標(biāo)準(zhǔn)
12.1.5 數(shù)據(jù)挖掘的Web標(biāo)準(zhǔn)
12.1.6 數(shù)據(jù)挖掘標(biāo)準(zhǔn)的應(yīng)用與未來(lái)發(fā)展趨勢(shì)
12.2 數(shù)據(jù)挖掘工具的介紹
12.2.1 數(shù)據(jù)挖掘工具發(fā)展過(guò)程概述
12.2.2 數(shù)據(jù)挖掘工具簡(jiǎn)介
12.2.3 WEKA
12.2.4 SPSS
12.3 數(shù)據(jù)挖掘產(chǎn)品分析
12.3.1 通用數(shù)據(jù)挖掘產(chǎn)品
12.3.2 專用挖掘產(chǎn)品
本章小結(jié)
習(xí)題12
附錄中英文術(shù)語(yǔ)對(duì)照
參考文獻(xiàn)