本書共分8章,主要內(nèi)容如下:
第1章介紹數(shù)據(jù)的認(rèn)知與研究任務(wù),大數(shù)據(jù)概念特征及技術(shù)挑戰(zhàn)等。
第2章介紹大數(shù)據(jù)內(nèi)容、知識和結(jié)果表達概念,以及元數(shù)據(jù)和知識圖譜技術(shù)。
第3章介紹數(shù)據(jù)存儲基礎(chǔ)、大數(shù)據(jù)存儲要求以及應(yīng)對技術(shù)和典型系統(tǒng)。
第4章介紹數(shù)據(jù)管理基礎(chǔ),新型數(shù)據(jù)管理模型及其相應(yīng)大數(shù)據(jù)管理系統(tǒng)。
第5章介紹數(shù)據(jù)計算基礎(chǔ),大數(shù)據(jù)計算特點,大數(shù)據(jù)的批量、流、圖等新計算模型和特點,以及計算引擎的工作原理等。
第6章介紹大數(shù)據(jù)分析概念、分類聚類等數(shù)據(jù)分析的基本方法,以及深度學(xué)習(xí)等數(shù)據(jù)分析的高級方法。
第7章介紹數(shù)據(jù)可視化概念、可視化方法與常用工具,以及大數(shù)據(jù)可視化面臨的問題及相應(yīng)方法。
第8章介紹大數(shù)據(jù)面臨的安全威脅和安全需求,以及針對大數(shù)據(jù)全生命周期不同階段的大數(shù)據(jù)安全技術(shù)。
更多科學(xué)出版社服務(wù),請掃碼獲取。
戰(zhàn)略支援部隊信息工程大學(xué)教授。長期從事網(wǎng)絡(luò)數(shù)據(jù)分析方向的研究工作。
目錄
第1章 大數(shù)據(jù)概述1
1.1 認(rèn)知數(shù)據(jù)1
1.1.1 數(shù)據(jù)概念1
1.1.2 數(shù)據(jù)研究內(nèi)容2
1.2 認(rèn)知大數(shù)據(jù)5
1.2.1 大數(shù)據(jù)形成6
1.2.2 大數(shù)據(jù)概念7
1.2.3 大數(shù)據(jù)技術(shù)9
1.3 大數(shù)據(jù)表達12
1.4 大數(shù)據(jù)面臨的挑戰(zhàn)14
1.4.1 數(shù)據(jù)復(fù)雜性帶來的挑戰(zhàn)14
1.4.2 計算復(fù)雜性帶來的挑戰(zhàn)15
1.4.3 系統(tǒng)復(fù)雜性帶來的挑戰(zhàn)15
思考題16
第2章 大數(shù)據(jù)表達方法17
2.1 元數(shù)據(jù)17
2.1.1 元數(shù)據(jù)形成18
2.1.2 元數(shù)據(jù)概念20
2.1.3 元數(shù)據(jù)體系22
2.2 大數(shù)據(jù)的元數(shù)據(jù)24
2.2.1 大數(shù)據(jù)的元數(shù)據(jù)標(biāo)準(zhǔn)24
2.2.2 元數(shù)據(jù)管理25
2.3 知識表示26
2.3.1 知識的概念26
2.3.2 知識表示的概念26
2.3.3 命題邏輯與謂詞邏輯29
2.3.4 語義網(wǎng)絡(luò)32
2.3.5 本體33
2.3.6 語義Web35
2.4 知識圖譜39
2.4.1 知識圖譜概念40
2.4.2 知識圖譜的數(shù)據(jù)模型40
2.4.3 知識圖譜的向量表示43
思考題45
第3章 大數(shù)據(jù)存儲46
3.1 數(shù)據(jù)存儲基礎(chǔ)46
3.1.1 數(shù)據(jù)存儲概念46
3.1.2 磁盤存儲原理48
3.1.3 磁盤陣列52
3.1.4 磁盤卷58
3.1.5 存儲空間59
3.2 數(shù)據(jù)存儲系統(tǒng)62
3.2.1 基于數(shù)據(jù)塊的存儲系統(tǒng)62
3.2.2 基于文件的存儲系統(tǒng)64
3.2.3 基于對象的存儲系統(tǒng)69
3.3 大數(shù)據(jù)存儲現(xiàn)狀69
3.3.1 大數(shù)據(jù)存儲面對的挑戰(zhàn)70
3.3.2 云存儲71
思考題72
第4章 大數(shù)據(jù)管理73
4.1 數(shù)據(jù)管理相關(guān)知識73
4.1.1 數(shù)據(jù)管理概念73
4.1.2 數(shù)據(jù)管理模型75
4.1.3 數(shù)據(jù)管理系統(tǒng)76
4.2 大數(shù)據(jù)管理面臨的主要問題79
4.3 分布式文件系統(tǒng)80
4.3.1 文件管理系統(tǒng)原理概述81
4.3.2 分布式文件管理系統(tǒng)原理85
4.3.3 典型的HDFS分布式文件系統(tǒng)90
4.4 NoSQL數(shù)據(jù)庫系統(tǒng)96
4.4.1 關(guān)系模型98
4.4.2 非關(guān)系模型99
4.4.3 NoSQL數(shù)據(jù)存儲109
4.4.4 NoSQL基本理論111
4.4.5 NoSQL體系框架112
思考題113
第5章 大數(shù)據(jù)計算115
5.1 計算系統(tǒng)及其體系結(jié)構(gòu)115
5.2 計算服務(wù)系統(tǒng)及其體系結(jié)構(gòu)118
5.3 大數(shù)據(jù)的計算類型及特點121
5.4 大數(shù)據(jù)的批量計算123
5.4.1 MapReduce及其計算123
5.4.2 Spark及其計算127
5.5 大數(shù)據(jù)的流式計算133
5.5.1 流數(shù)據(jù)概念及特點133
5.5.2 Spark Streaming及其流計算134
5.5.3 Storm及其流計算138
5.6 大數(shù)據(jù)的圖計算141
5.6.1 BSP模型142
5.6.2 圖計算系統(tǒng)Pregel145
思考題146
第6章 大數(shù)據(jù)分析148
6.1 大數(shù)據(jù)分析概念148
6.2 數(shù)據(jù)分析的基本方法149
6.2.1 數(shù)據(jù)分類算法149
6.2.2 數(shù)據(jù)聚類方法157
6.2.3 關(guān)聯(lián)規(guī)則算法163
6.2.4 圖數(shù)據(jù)分析168
6.3 數(shù)據(jù)分析的高級方法173
6.3.1 深度學(xué)習(xí)173
6.3.2 強化學(xué)習(xí)178
6.3.3 遷移學(xué)習(xí)180
思考題181
第7章 大數(shù)據(jù)可視化182
7.1 數(shù)據(jù)可視化概述182
7.1.1 可視化與可視化技術(shù)182
7.1.2 數(shù)據(jù)可視化概念183
7.1.3 數(shù)據(jù)可視化作用184
7.2 數(shù)據(jù)可視化技術(shù)186
7.2.1 數(shù)據(jù)基本統(tǒng)計特征的可視化186
7.2.2 高維數(shù)據(jù)的可視化189
7.2.3 面向大數(shù)據(jù)主流應(yīng)用的信息可視化192
7.3 常用數(shù)據(jù)可視化工具198
7.3.1 基于Excel的數(shù)據(jù)可視化198
7.3.2 基于Tableau的數(shù)據(jù)可視化201
7.3.3 基于JavaScript開發(fā)的數(shù)據(jù)可視分析205
7.4 大數(shù)據(jù)可視化面臨問題與挑戰(zhàn)211
思考題212
第8章 大數(shù)據(jù)安全213
8.1 大數(shù)據(jù)安全概覽213
8.1.1 大數(shù)據(jù)安全形勢213
8.1.2 大數(shù)據(jù)安全威脅214
8.1.3 大數(shù)據(jù)安全需求214
8.2 大數(shù)據(jù)安全技術(shù)215
8.2.1 匿名認(rèn)證技術(shù)215
8.2.2 訪問控制安全技術(shù)220
8.2.3 數(shù)據(jù)存儲完整性證明技術(shù)225
8.2.4 數(shù)據(jù)處理安全技術(shù)228
8.2.5 數(shù)據(jù)發(fā)布隱私保護技術(shù)234
思考題238
參考文獻239