《大數(shù)據(jù)實驗教程》以大數(shù)據(jù)開源平臺Hadoop和Spark生態(tài)體系為基礎,介紹常見的大數(shù)據(jù)開源軟件的基礎知識、安裝部署和使用等內容,重點介紹Hadoop和Spark編程基礎知識。
第1章 大數(shù)據(jù)技術概述
1.1 大數(shù)據(jù)技術
1.2 大數(shù)據(jù)工具
第2章 配置實驗基礎環(huán)境
2.1 實驗拓撲架構及其環(huán)境布局
2.2 安裝vMware及虛擬操作系統(tǒng)
2.3 配置大數(shù)據(jù)實驗平臺環(huán)境
2.4 Linux操作系統(tǒng)及相關軟件的使用
2.5 本章小結
第3章 安裝和使用Hadoop單機版
3.1 修改配置文件
3.2 啟動和測試Hadoop
3.3 常見錯誤處理
3.4 本章小結
第4章 安裝Zookeeper集群
4.1 基礎知識
4.2 安裝Zookeeper集群
4.3 啟動和測試Zookeeper
4.4 常見錯誤處理
4.5 本章小結
第5章 安裝和使用Hadoop偽分布式集群
5.1 基礎知識
5.2 配置偽分布式集群
5.3 啟動和測試Hadoop偽分布式集群
5.4 本章小結
第6章 安裝和使用Hadoop全分布式集群
6.1 基礎知識
6.2 修改配置文件
6.3 配置集群
6.4 啟動和測試Hadoop集群
6.5 常見錯誤處理
6.6 本章小結
第7章 HDFs應用與編程
7.1 HDFS常用命令
7.2 配置HDFS編程環(huán)境
7.3 HDFS編程實踐
7.4 常見錯誤處理
7.5 本章小結
第8章 MapReduce初級編程
8.1 基于Java的MapReduce編程
8.2 基于Python的MapReduce編程
8.3 常見錯誤處理
8.4 本章小結
第9章 MapReduce高級編程
9.1 TopN排序
9.2 計算平均值
9.3 計算最大值
9.4 本章小結
第10章 安裝和使用Hbase數(shù)據(jù)庫
10.1 基礎知識
10.2 安裝Hbase
10.3 啟動和測試Hbase
10.4 Hbase常用的shell命令
10.5 本章小結
第11章 安裝和簡單使用Hive數(shù)據(jù)倉庫
11.1 基礎知識
11.2 MySQL服務
11.3 安裝和配置Hive
11.4 啟動Hive服務
11.5 Hive的常用shell命令
11.6 本章小結
第12章 安裝和使用Spark集群
12.1 基礎知識
12.2 安裝Spark
12.3 安裝Scala
12.4 啟動和測試Spark
12.5 常見錯誤處理
12.6 本章小結
第13章 Spark初級編程
13.1 基礎知識
13.2 使用spark.shell編寫代碼
13.3 使用sbt編譯scala原生程序
13.4 編寫Spark獨立應用程序
13.5 本章小結
第14章 安裝和使用Kafka流平臺
14.1 基礎知識
14.2 部署Kafka集群
14.3 啟動與測試Kafka集群
14.4 本章小結
第15章 安裝和使用Storm實時流平臺
15.1 基礎知識
15.2 配置Storm集群
15.3 啟動和測試Storm集群
15.4 常見錯誤處理
15.5 本章小結
第16章 安裝和使用Flume海量數(shù)據(jù)流平臺
16.1 基礎知識
16.2 配置Flume集群
16.3 啟動和測試Flume集群
16.4 本章小結
第17章 安裝和使用Neo4j
17.1 基礎知識
17.2 安裝Neo4j
17.3 啟動和測試Neo4j
17.4 Cypher簡單應用
17.5 IDEA簡單操作
17.6 Pycharm簡單操作
17.7 本章小結
第18章 安裝和使用ElasticSearch
18.1 基礎知識
18.2 安裝ElasticSearch
18.3 使用ElasticSearch
18.4 常見錯誤處理
18.5 本章小結
第19章 安裝和使用Redis
19.1 基礎知識
19.2 Redis安裝
19.3 啟動和使用Redis
19.4 本章小結
參考文獻