亚洲无卡无码在线观看,日韩乱码人妻无码中文字幕

本書系統(tǒng)梳理總結(jié)ApacheHadoop大數(shù)據(jù)相關(guān)技術(shù)，介紹大數(shù)據(jù)存儲、并行計算、數(shù)據(jù)處理等內(nèi)容，幫助讀者形成對大數(shù)據(jù)知識體系及其應用領(lǐng)域的輪廓性認識，為讀者在大數(shù)據(jù)領(lǐng)域進行更深入的學習和研究奠定基礎(chǔ)、指明方向。

2012年后，大數(shù)據(jù)（BagData）一詞越來越多地被提及，人們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù)，并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。

隨著云時代的來臨，大數(shù)據(jù)吸引了越來越多的關(guān)注，數(shù)據(jù)正在迅速膨脹并變大，它決定著企業(yè)的未來發(fā)展，雖然很多企業(yè)可能并沒有意識到數(shù)據(jù)爆炸性增長帶來問題的隱患，但是隨著時間的推移，人們將越來越多地意識到數(shù)據(jù)對企業(yè)的重要性，大數(shù)據(jù)通常用來形容一個公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)，這些數(shù)據(jù)在下載到關(guān)系數(shù)據(jù)庫時用于分析會花費過多的時間和金錢，大數(shù)據(jù)分析常和云計算聯(lián)系到一起，因為實時的大型數(shù)據(jù)分析需要像MapReduce一樣的計算框架來向數(shù)十、數(shù)百甚至數(shù)千臺計算機分配工作。

本書主要向讀者介紹一種大規(guī)模數(shù)據(jù)處理的開源框架——Hadoop生態(tài)系統(tǒng)。在深入探討Hadoop的技術(shù)細節(jié)和應用之前，有必要花時間來了解Hadoop及其取得巨的歷史背景，Hadoop并不是憑空想象出來的，它的出現(xiàn)源于人們創(chuàng)建和使用的數(shù)據(jù)量的爆炸性增長。在此背景下，不僅龐大的跨國公司面臨著海量數(shù)據(jù)處理的困難，小型創(chuàng)業(yè)公司同樣如此。與此同時，一些變革改變了軟件和系統(tǒng)的部署方式，除了傳統(tǒng)的基礎(chǔ)設(shè)施，人們開始使用甚至偏好于分布式資源處理框架。

本書揭開了Apache Hadoop的神秘面紗，著重講解了如何應用Hadoop和相關(guān)技術(shù)搭建工作系統(tǒng)并完成任務(wù)。本書共分為9章：第pan>章講解Hadoop的生態(tài)系統(tǒng)，以及在行業(yè)中的應用場景；第2章講解Hadoop分布式文件系統(tǒng)括NameNode和DataNode節(jié)點、機架感知策略、HDFS Shell 命令等；第3 章講解MapReduce 并行計算框架，讓讀者了解MapReduce的工作原理：第4章講解HBase分布式數(shù)據(jù)庫，講述了HBase 如何實現(xiàn)數(shù)據(jù)存儲、HBase 的節(jié)點類型、HBase API開發(fā)：第5章講解Hive 數(shù)據(jù)倉庫，介紹了Hive 的架構(gòu)、HQL語法結(jié)構(gòu)、Hive 數(shù)據(jù)查詢案例：第6章講解Kafka 消息系統(tǒng)，介紹了Kafka消息系統(tǒng)的工作原理、Kafka消息細節(jié)處理等；第7章講解Flume 日志處理系統(tǒng)，介紹了Flume的日志處理技術(shù)，F(xiàn)lume 如行流計算技術(shù)處理：第8章講郁Zookeper分布式協(xié)調(diào)系統(tǒng)，幫助讀者理解如何實現(xiàn)Hadoop組件之問的協(xié)調(diào)控制：第9意講解 Sagoop數(shù)據(jù)遷移工具，涵蓋了有效使用Sqoop處理實際場景中的數(shù)據(jù)遷移工作。

通過閱讀本書，讀者將迅速掌握編程概念，打下堅實的基礎(chǔ)，并養(yǎng)成良好的習慣。此后，讀者就可以開始了解其他大數(shù)臺技術(shù)，如Spark內(nèi)存計算框架、Flink流扯一體化處臺，并能夠更輕松地掌握大數(shù)據(jù)技術(shù)。

你還可能感興趣

我要評論