《大數(shù)據(jù)科學技術研究》將通過大數(shù)據(jù)技術基礎、大數(shù)據(jù)應用場景、大數(shù)據(jù)建模分析和預測等三個方面,深入淺出的結(jié)合相關理論基礎和技術的應用,給出大數(shù)據(jù)技術應用案例,內(nèi)容通俗易懂,便于讀者學習。同時,根據(jù)當前數(shù)字時代需求,首先梳理分析計算機基礎、計算機網(wǎng)絡基礎、大數(shù)據(jù)發(fā)展概論、大數(shù)據(jù)分析工具、python程序設計基礎在大數(shù)據(jù)科學中的作用和應用,為讀者打下堅實的理論基礎,然后結(jié)合大數(shù)據(jù)應用案例,以及如何使用大數(shù)據(jù)科學技術,系統(tǒng)而生動地講解了大數(shù)據(jù)科學技術的應用實踐,將成為從事大數(shù)據(jù)科學技術從業(yè)人員參考書籍之一,適合作為網(wǎng)絡空間安全、信息安全、計算機科學與技術、公安技術等相關學科專業(yè)本科高年級和研究生的教材,也可供高校教師,相關科研以及技術和管理人員等領域工作者參考和使用。
羅勇,男,博士,中國傳媒大學,通信與信息系統(tǒng)專業(yè);湖北警官學院信息技術系計算機科學與技術教研室主任,電子取證及可信應用湖北省協(xié)同創(chuàng)新中心研究員、法庭科學湖北省重點實驗室成員、湖北省公安技術優(yōu)勢特色學科(群)成員。一直從事計算機科學技術與應用專業(yè)相關方向的教學與研究,出版專著一部,參編教材數(shù)部,公開發(fā)表學術論文數(shù)十篇。
第一部分 基礎篇/1
第1章 計算機基礎概述/2
11計算機的發(fā)展簡史/2
12 計算機分類/3
13 計算機技術發(fā)展趨勢/6
14 云計算技術/10
第2章 大數(shù)據(jù)概述/12
21 大數(shù)據(jù)的定義/12
22 大數(shù)據(jù)的歷史/12
23 大數(shù)據(jù)的類型/13
24 大數(shù)據(jù)的特點/14
25 大數(shù)據(jù)處理的優(yōu)勢/15
26 大數(shù)據(jù)的重要性/15
27 商業(yè)智能與大數(shù)據(jù)的對比/16
28 大數(shù)據(jù)和數(shù)據(jù)倉庫/16
29 大數(shù)據(jù)分析的分類/17
210 大數(shù)據(jù)環(huán)境中的關聯(lián)技術/19
211 大數(shù)據(jù)分析面臨的挑戰(zhàn)/22
第3章 大數(shù)據(jù)科學技術/24
31 大數(shù)據(jù)科學技術概述/24
32 大數(shù)據(jù)采集與存儲技術/25
33 大數(shù)據(jù)處理技術27
34 大數(shù)據(jù)分析與應用技術/29
35 典型行業(yè)數(shù)據(jù)類型分析/31
36 大數(shù)據(jù)安全與隱私保護技術/32
37 大數(shù)據(jù)科學技術的未來發(fā)展/33
第4章 大數(shù)據(jù)Hadoop生態(tài)體系/35
41 HADOOP安裝配置過程 /35
42 HDFS/36
43 MapReduce/38
44 Hive/42
45 Spark /45
46 Spark SQL/48
第二部分 Python程序設計/51
第5章 開發(fā)工具介紹與安裝/52
51 Python/52
52 Anaconda/53
53 Jupyter notebook/60
第6章 Python基本數(shù)據(jù)類型/63
61 Python算術運行/63
62 基本數(shù)據(jù)類型/65
第7章 數(shù)據(jù)結(jié)構/69
71 變量/69
72 列表/71
73 元組和字符串/75
74 字典和集合/78
75 數(shù)字數(shù)組/80
76 Pandas DataFrames/89
77 讀寫數(shù)據(jù)/98
78 Python編程結(jié)構/102
第8章 Python的數(shù)據(jù)分析/106
81 Python數(shù)據(jù)分析簡介/106
82 探索性分析/106
第9章 基于Python預測建模/118
91 線性回歸/118
92 邏輯回歸/132
第三部分 基于Python的大數(shù)據(jù)實戰(zhàn)案例/139
第10章 Python爬蟲技術/140
101 Beautiful Soup/141
102 Scrapy/141
103 Selenium/142
104 Requests/143
105 Urllib3/143
106 LXML/144
107 Mechanical Soup/144
108 Python Web抓取工具之間的比較/145
109 基于Python的網(wǎng)絡爬蟲設計/146
第11章 基于Python爬蟲的旅游評論分析/150
111 jieba分詞 /151
112 自然語言處理工具NLTK/155
113 情感傾向分析方法概念及其模型/159
114 基于Python的情感傾向分析方法設計與實現(xiàn)/161
115 情感傾向分析方法的函數(shù)實現(xiàn)/164
116 情感傾向分析方法性能研究/167
117 小結(jié)/168
第12章 Python中的情感分析/169
121 情感分析的應用/169
122 數(shù)據(jù)收集/169
123 程序設計與實現(xiàn)170
124 小結(jié)/179
第13章 基于LSTM的電影評論分類研究/180
131 LSTM簡介/180
132 IMDB電影評論數(shù)據(jù)集/181
133 LSTM網(wǎng)絡搭建/183
134 LSTM電影評論分類/185
第14章 大數(shù)據(jù)時代網(wǎng)絡安全/189
141 網(wǎng)絡安全威脅/189
142 安全防御/193
143 網(wǎng)絡安全威脅和趨勢/196
144 移動網(wǎng)絡攻擊威脅/197
參考文獻/201