機械工業(yè)出版社本教材首先介紹了數(shù)據(jù)分析的基本概念和方法,然后通過大量實例介紹了如何使用Matlab實現(xiàn)數(shù)據(jù)分析,并深入淺出地介紹了數(shù)據(jù)建模過程中的有關(guān)方法。本教材共分8章,主要內(nèi)容包括:數(shù)據(jù)的基本概念及其應(yīng)用、Matlab基礎(chǔ)、隨機模擬、數(shù)據(jù)預(yù)處理、數(shù)據(jù)探索與分析、多元線性回歸模型、聚類分析和分類。本教材可作為職業(yè)院校計算機相關(guān)專業(yè)的教學(xué)用書,也可供相關(guān)技術(shù)人員參考。
前言
第1章數(shù)據(jù)的基本概念及其應(yīng)用
11數(shù)據(jù)與數(shù)據(jù)處理
111數(shù)據(jù)的相關(guān)基本概念
112數(shù)據(jù)處理的主要概念
113數(shù)據(jù)處理的流程
114數(shù)據(jù)處理的誤區(qū)
12數(shù)據(jù)處理涉及的主要領(lǐng)域
121統(tǒng)計學(xué)
122數(shù)據(jù)挖掘
123云計算
13數(shù)據(jù)處理的主要方法
131數(shù)據(jù)采集
132數(shù)據(jù)預(yù)處理
133數(shù)據(jù)分析
134數(shù)據(jù)挖掘算法
第2章Matlab基礎(chǔ)
21Matlab簡介
211Matlab的特點
212Matlab窗口簡介
22數(shù)組及其運算
221變量和數(shù)組
222變量的初始化
223多維數(shù)組
224子數(shù)組
225單元陣列
226顯示輸出數(shù)據(jù)
227數(shù)據(jù)文件
228數(shù)組運算和矩陣運算
229內(nèi)置函數(shù)
23作圖入門
231簡單的直角坐標(biāo)系作圖
232作圖的附加特性
24Matlab程序設(shè)計
241關(guān)系運算符和邏輯運算符
242選擇結(jié)構(gòu)
243循環(huán)結(jié)構(gòu)
25自定義函數(shù)
第3章隨 機 模 擬
31隨機數(shù)的生成
32蒙特卡羅模擬
321蒙特卡羅模擬估計面積
322蒙特卡羅模擬尋求近似圓周率
323蒙特卡羅模擬解決生日問題
33隨機行為的模擬
34蒙特卡羅模擬應(yīng)用案例:理發(fā)店系統(tǒng)研究
Matlab數(shù)據(jù)分析第1章數(shù)據(jù)的基本概念及其應(yīng)用第4章數(shù)據(jù)預(yù)處理
41認識數(shù)據(jù)
411屬性
412離散屬性和連續(xù)屬性
42數(shù)據(jù)預(yù)處理概述
421數(shù)據(jù)清洗
422數(shù)據(jù)集成
423數(shù)據(jù)歸約
424數(shù)據(jù)變換
43Matlab與Excel的數(shù)據(jù)交互
431以交互方式導(dǎo)入數(shù)據(jù)
432讀取和寫入表
433大型文件和大型數(shù)據(jù)簡介
434數(shù)據(jù)的清理、平滑和分組等
第5章數(shù)據(jù)探索與分析
51數(shù)據(jù)的特征統(tǒng)計量
511中心度量趨勢:均值、中位數(shù)、眾數(shù)
512常用的變異程度度量
513分布形態(tài)
52基本統(tǒng)計描述的可視化
521分類型數(shù)據(jù)頻數(shù)分布及其可視化
522直方圖
523分位數(shù)圖和經(jīng)驗累計分布函數(shù)
524分位數(shù)分位數(shù)圖——qq圖
525箱形圖
526散點圖
53度量數(shù)據(jù)的相似性和相異性
531數(shù)據(jù)矩陣、相異性矩陣、相似性矩陣
532數(shù)值屬性的相似性:相關(guān)系數(shù)
533數(shù)值屬性的相異性:距離
54數(shù)據(jù)降維——主成分分析
第6章多元線性回歸模型
61概述
62一元曲線擬合
621案例1——百貨商場銷售額
622確定最優(yōu)擬合
623導(dǎo)出模型到工作空間
63多元線性回歸模型
631案例2——牙膏的銷售量
632案例3——自變量含有分類變量的處理
64逐步回歸模型
第7章聚 類 分 析
71簡介
711聚類分析的類型
712聚類分析的依據(jù)
72譜系聚類
73k均值聚類
731k均值聚類概述
732k均值聚類算法的Matlab函數(shù)
733k均值聚類算法的特點
734k均值聚類算法綜合應(yīng)用
74層次聚類
741概述
742層次聚類算法的Matlab實現(xiàn)
743層次聚類算法的特點
75高斯混合模型聚類
751簡介
752高斯混合模型聚類算法的Matlab實現(xiàn)
第8章分類
81分類算法簡介
811邏輯回歸分類算法
812K近鄰分類算法
813支持向量機分類算法
814人工神經(jīng)網(wǎng)絡(luò)分類算法
815樸素貝葉斯分類算法
816判別分析分類算法
817決策樹分類算法
818集成學(xué)習(xí)分類算法
82分類的評判
821評判指標(biāo)
822ROC曲線和AUC
83判別分析分類的具體應(yīng)用
831判別分析的定義、特點和類型
832距離判別
833貝葉斯判別
84使用Classification Learner App實現(xiàn)分類
參 考 文 獻