基于SPSS Modeler的數(shù)據(jù)挖掘(第二版)(統(tǒng)計(jì)數(shù)據(jù)分析與應(yīng)用叢書)
定 價(jià):49 元
叢書名:統(tǒng)計(jì)數(shù)據(jù)分析與應(yīng)用叢書
- 作者:薛薇
- 出版時(shí)間:2014/10/22
- ISBN:9787300200699
- 出 版 社:中國(guó)人民大學(xué)出版社
- 中圖法分類:C819
- 頁(yè)碼:404
- 紙張:膠版紙
- 版次:2
- 開本:16開
數(shù)據(jù)挖掘具有廣闊的應(yīng)用領(lǐng)域和發(fā)展前景。SPSS Modeler因界面友好且操作簡(jiǎn)捷,成為公認(rèn)的數(shù)據(jù)挖掘?qū)崙?zhàn)的首選軟件。
基于多年的教學(xué)和科研經(jīng)驗(yàn),作者深知數(shù)據(jù)挖掘理論和軟件操作相結(jié)合的重要性,努力在本書中突出以下特點(diǎn):
以數(shù)據(jù)挖掘過(guò)程為線索講解Modeler軟件操作。本書以數(shù)據(jù)挖掘?qū)嵺`過(guò)程為主線,從Modeler數(shù)據(jù)管理入手,說(shuō)明問(wèn)題由淺入深,講解方法從易到難,旨在使讀者在較短時(shí)間內(nèi)掌握Modeler的基本功能和一般方法,并迅速運(yùn)用到數(shù)據(jù)挖掘?qū)崙?zhàn)中。
數(shù)據(jù)挖掘理論的講解通俗易懂,避免數(shù)學(xué)公式的羅列。本書對(duì)Modeler中的經(jīng)典數(shù)據(jù)挖掘算法娓娓道來(lái),旨在使讀者知其然更知其所以然,加深對(duì)數(shù)據(jù)挖掘分析結(jié)論的理解和應(yīng)用。
將數(shù)據(jù)挖掘方法、軟件操作、案例分析有機(jī)結(jié)合。本書在論述數(shù)據(jù)挖掘方法核心思想和基本原理的同時(shí),配合案例數(shù)據(jù)展示實(shí)戰(zhàn)過(guò)程,旨在使讀者直觀理解理論,正確應(yīng)用方法。
薛薇,工學(xué)碩士,經(jīng)濟(jì)學(xué)博士,中國(guó)人民大學(xué)應(yīng)用統(tǒng)計(jì)科學(xué)研究中心副主任,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院副教授。關(guān)注數(shù)據(jù)挖掘及統(tǒng)計(jì)建模、統(tǒng)計(jì)和數(shù)據(jù)挖掘軟件應(yīng)用、統(tǒng)計(jì)數(shù)據(jù)庫(kù)系統(tǒng)研發(fā)等方面。涉足網(wǎng)絡(luò)新媒體輿論傳播和互動(dòng)建模、政府和官方微博分析、電商數(shù)據(jù)分析、學(xué)科學(xué)術(shù)熱點(diǎn)跟蹤等文本挖掘,以及社會(huì)網(wǎng)絡(luò)分析和以數(shù)據(jù)挖掘?yàn)橐劳械目蛻絷P(guān)系管理等領(lǐng)域。
目錄
第1章數(shù)據(jù)挖掘和Modeler使用概述
1.1數(shù)據(jù)挖掘的產(chǎn)生背景
1.2什么是數(shù)據(jù)挖掘
1.3Modeler軟件概述
第2章Modeler的數(shù)據(jù)讀入和數(shù)據(jù)集成
目錄
第1章數(shù)據(jù)挖掘和Modeler使用概述
1.1數(shù)據(jù)挖掘的產(chǎn)生背景
1.2什么是數(shù)據(jù)挖掘
1.3Modeler軟件概述
第2章Modeler的數(shù)據(jù)讀入和數(shù)據(jù)集成
2.1變量類型
2.2讀入數(shù)據(jù)
2.3生成實(shí)驗(yàn)方案
2.4數(shù)據(jù)集成
第3章Modeler的數(shù)據(jù)理解
3.1變量說(shuō)明
3.2數(shù)據(jù)質(zhì)量的評(píng)估和調(diào)整
3.3數(shù)據(jù)的排序
3.4數(shù)據(jù)的分類匯總
第4章Modeler的數(shù)據(jù)準(zhǔn)備
4.1變量變換
4.2變量派生
4.3數(shù)據(jù)精簡(jiǎn)
4.4數(shù)據(jù)篩選
4.5數(shù)據(jù)準(zhǔn)備的其他工作
第5章Modeler的基本分析
5.1數(shù)值型變量的基本分析
5.2兩分類型變量相關(guān)性的研究
5.3兩總體的均值比較
5.4RFM分析
第6章Modeler的數(shù)據(jù)精簡(jiǎn)
6.1變量值的離散化處理
6.2特征選擇
6.3因子分析
第7章分類預(yù)測(cè):Modeler的決策樹
7.1決策樹算法概述
7.2Modeler的C50算法及應(yīng)用
7.3Modeler的分類回歸樹及應(yīng)用
7.4Modeler的CHAID算法及應(yīng)用
7.5Modeler的QUEST算法及應(yīng)用
7.6模型的對(duì)比分析
第8章分類預(yù)測(cè):Modeler的人工神經(jīng)網(wǎng)絡(luò)
8.1人工神經(jīng)網(wǎng)絡(luò)算法概述
8.2Modeler的BP反向傳播網(wǎng)絡(luò)
8.3Modeler的BP反向傳播網(wǎng)絡(luò)的應(yīng)用
8.4Modeler的徑向基函數(shù)網(wǎng)絡(luò)及應(yīng)用
第9章分類預(yù)測(cè):Modeler的支持向量機(jī)
9.1支持向量分類的基本思路
9.2支持向量分類的基本原理
9.3支持向量回歸
9.4支持向量機(jī)的應(yīng)用
第10章分類預(yù)測(cè):Modeler的貝葉斯網(wǎng)絡(luò)
10.1貝葉斯方法基礎(chǔ)
10.2貝葉斯網(wǎng)絡(luò)概述
10.3TAN貝葉斯網(wǎng)絡(luò)
10.4馬爾科夫毯網(wǎng)絡(luò)
10.5貝葉斯網(wǎng)絡(luò)的應(yīng)用
第11章探索內(nèi)部結(jié)構(gòu):Modeler的聚類分析
數(shù)據(jù)挖掘技術(shù)具有廣闊的應(yīng)用領(lǐng)域和發(fā)展前景,眾多有識(shí)之士紛紛選擇SPSS Modeler作為數(shù)據(jù)挖掘的工具軟件,因此SPSS Modeler軟件已經(jīng)連續(xù)多年雄踞數(shù)據(jù)挖掘應(yīng)用軟件之首。
Modeler的前身名為Clementine,2009年IBM公司收購(gòu)了SPSS數(shù)據(jù)分析軟件公司,并將其廣受贊譽(yù)的SPSS統(tǒng)計(jì)分析軟件和Clementine數(shù)據(jù)挖掘軟件進(jìn)行整合,將Clementine更名為
SPSS Modeler(簡(jiǎn)稱Modeler)后再次推向全球市場(chǎng)。
Modeler充分利用計(jì)算機(jī)系統(tǒng)的運(yùn)算處理能力和圖形展現(xiàn)能力,將方法、應(yīng)用與工具有機(jī)地融為一體,是解決數(shù)據(jù)挖掘問(wèn)題的最理想工具。
Modeler不但集成了諸多計(jì)算機(jī)科學(xué)中機(jī)器學(xué)習(xí)的優(yōu)秀算法,同時(shí)也綜合了一些行之有效的統(tǒng)計(jì)分析方法,成為內(nèi)容最為全面、功能最為強(qiáng)大、使用最為方便的數(shù)據(jù)挖掘軟件產(chǎn)品。
Modeler繼續(xù)保持了SPSS產(chǎn)品的一貫風(fēng)格:界面友好且操作簡(jiǎn)捷。原因在于Modeler始終把自己的操作者定位于實(shí)際工作部門的一線人員,而不是數(shù)據(jù)分析專家。這種所謂“傻瓜型”軟件成為Modeler不斷開拓市場(chǎng)的利器。
本書作者一直從事計(jì)算機(jī)數(shù)據(jù)分析的教學(xué)與科研工作,并長(zhǎng)期跟蹤研究SPSS公司的數(shù)據(jù)分析系列產(chǎn)品,具有相當(dāng)豐富的數(shù)據(jù)分析軟件開發(fā)經(jīng)驗(yàn)。因此深知,一個(gè)基礎(chǔ)相對(duì)薄弱的讀者應(yīng)該從哪些方面入手,才能很快地使用Modeler開始數(shù)據(jù)分析工作,并逐步成長(zhǎng)為一名有經(jīng)驗(yàn)的多面手。
我們認(rèn)為讀者掌握Modeler軟件應(yīng)體現(xiàn)三個(gè)層面:首先是軟件操作層面,讀者通過(guò)實(shí)際操作,盡快掌握軟件的使用方法和處理步驟;其次是結(jié)果分析層面,讀者通過(guò)案例演示,基本明白軟件的輸出結(jié)果,從而得出正確的分析結(jié)論;最后是方法論層面,讀者通過(guò)對(duì)某個(gè)算法基本思路的了解,進(jìn)一步提高方法應(yīng)用和分析水平,升華對(duì)數(shù)據(jù)挖掘方法的認(rèn)識(shí)。所以,注重對(duì)每種方法的操作使用、結(jié)果分析和算法基本思路的講解是本書最重要的特征。
本書適用于從事數(shù)據(jù)分析的各應(yīng)用領(lǐng)域的讀者,尤其是商業(yè)銷售、財(cái)會(huì)金融、證券保險(xiǎn)、經(jīng)濟(jì)管理、社會(huì)研究、人文教育等行業(yè)的相關(guān)人員。同時(shí),也能夠作為高等院校計(jì)算機(jī)類、財(cái)經(jīng)類、管理類專業(yè)本科生和研究生的數(shù)據(jù)挖掘教材。
針對(duì)上述讀者群,在全書的編寫中我們努力體現(xiàn)以下特色:
1.以數(shù)據(jù)挖掘過(guò)程為線索介紹Modeler
目前,具備基本的計(jì)算機(jī)操作能力已經(jīng)不是讀者的主要障礙,數(shù)據(jù)挖掘的過(guò)程與方法才是讀者關(guān)心的主題和應(yīng)用的難點(diǎn)。所以,本書以數(shù)據(jù)挖掘的實(shí)踐過(guò)程為主線,從Modeler數(shù)據(jù)管理入手,說(shuō)明問(wèn)題從淺至深,講解方法從易到難。這樣,能使讀者在較短時(shí)間內(nèi)掌握Modeler的基本功能和一般方法,并可迅速運(yùn)用到實(shí)際工作中去。
2.將數(shù)據(jù)挖掘方法、軟件操作、案例分析有機(jī)結(jié)合
目前,經(jīng)過(guò)消化的中文圖書和資料相對(duì)短缺,Modeler相關(guān)圖書一般都比較側(cè)重對(duì)其英文手冊(cè)的翻譯介紹,側(cè)重于對(duì)計(jì)算機(jī)操作過(guò)程的描述。而對(duì)數(shù)據(jù)挖掘方法則較多地羅列數(shù)學(xué)公式,輸出結(jié)果也缺少恰當(dāng)?shù)慕忉�。本書則結(jié)合實(shí)際案例,側(cè)重?cái)?shù)據(jù)挖掘方法核心思想和基本原理的闡述,以使讀者直觀理解方法,正確掌握方法的應(yīng)用范圍。
3. 數(shù)據(jù)挖掘方法講解全面,語(yǔ)言通俗
本書對(duì)Modeler的數(shù)據(jù)挖掘算法進(jìn)行了全面的分析和應(yīng)用,內(nèi)容力求豐富翔實(shí)。同時(shí)使用通俗的語(yǔ)言和示例講述算法,盡量避免使用公式和推導(dǎo)堆砌算法。
請(qǐng)讀者到人大經(jīng)管圖書在線(http://wwwrdjgcomcn)下載本書案例數(shù)據(jù)和數(shù)據(jù)流文件。數(shù)據(jù)流文件需使用Modeler 14.2以上版本打開,執(zhí)行時(shí)只需修改數(shù)據(jù)源節(jié)點(diǎn)中的數(shù)據(jù)文件所在目錄項(xiàng),即可正確執(zhí)行流文件。
在此特別感謝中國(guó)人民大學(xué)出版社對(duì)本書出版的大力支持和各位編輯熱情細(xì)致的工作。由于水平所限,書中難免出現(xiàn)問(wèn)題和錯(cuò)誤,敬請(qǐng)各位讀者批評(píng)指正。