Hadoop理論與實(shí)踐/大數(shù)據(jù)人工智能系列叢書
定 價:58 元
叢書名:大數(shù)據(jù)人工智能系列叢書
- 作者:李平 著,北京百里半網(wǎng)絡(luò)技術(shù)有限公司 編
- 出版時間:2021/1/1
- ISBN:9787302559504
- 出 版 社:清華大學(xué)出版社
- 中圖法分類:TP274
- 頁碼:217
- 紙張:膠版紙
- 版次:1
- 開本:16開
《Hadoop理論與實(shí)踐/大數(shù)據(jù)人工智能系列叢書》按照高等學(xué)校大數(shù)據(jù)、人工智能課程基本要求,以案例驅(qū)動的形式來組織內(nèi)容,突出該課程的實(shí)踐性特點(diǎn)。
《Hadoop理論與實(shí)踐/大數(shù)據(jù)人工智能系列叢書》主要包含四大部分:Hadoop技術(shù)、數(shù)據(jù)倉庫與Hive、Flume分布式日志處理系統(tǒng)、Spark及其生態(tài)圈概述。其中,Hadoop技術(shù)包括大數(shù)據(jù)與數(shù)據(jù)分析、Hadoop生態(tài)系統(tǒng)介紹、Hadoop存儲、Hadoop計算之MapReduce、Hadoop安全等;數(shù)據(jù)倉庫與Hive包括Hive與數(shù)據(jù)庫的基礎(chǔ)知識、Hive的高級特性、Hive優(yōu)化及案例的應(yīng)用;Flume分布式日志處理系統(tǒng)包括Flume介紹、Flume使用案例及Flume開發(fā)案例的應(yīng)用;Spark及其生態(tài)圈概述包括Spark簡介及Spark生態(tài)系統(tǒng)詳解。
《Hadoop理論與實(shí)踐/大數(shù)據(jù)人工智能系列叢書》內(nèi)容安排合理,層次清晰,通俗易懂,實(shí)例豐富,突出理論與實(shí)踐的結(jié)合,可作為各類高等院校人工智能與大數(shù)據(jù)相關(guān)專業(yè)的教材,也可供廣大程序設(shè)計人員參考。
大數(shù)據(jù)是什么?在過去的十年間,恐怕沒有一個詞比大數(shù)據(jù)更高頻了,也沒有一個概念如大數(shù)據(jù)一樣,眾說紛紜。2014年,阿里巴巴集團(tuán)總裁馬云提出,“人類正從IT時代走向DT時代”。DT(data technology)時代,以服務(wù)大眾、激發(fā)生產(chǎn)力為主。以物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)和人工智能為代表的新技術(shù)革命正在滲透至各行各業(yè),改變著我們的生活。
Hadoop是Apache軟件基金會下的一個頂級項(xiàng)目,它是目前大數(shù)據(jù)行業(yè)的基礎(chǔ)支撐。Hadoop改變了大數(shù)據(jù)的存儲、處理和分析的過程,強(qiáng)有力地驅(qū)動了大數(shù)據(jù)行業(yè)的發(fā)展,形成了自己的生態(tài)圈。
本書對Hadoop的架構(gòu)、原理和生態(tài)系統(tǒng)組成進(jìn)行了詳細(xì)的解讀,結(jié)構(gòu)清晰,對于需要詳細(xì)了解和應(yīng)用Hadoop的讀者是一個不錯的選擇。
本書是北京百里半網(wǎng)絡(luò)技術(shù)有限公司所編著的“大數(shù)據(jù)人工智能系列叢書”中的一本,它為該系列的其他幾本專業(yè)教材提供了大數(shù)據(jù)入門的支撐。
本書凝聚了編委會多年來的教學(xué)經(jīng)驗(yàn)和成果,內(nèi)容安排合理,層次清晰,通俗易懂,實(shí)例豐富,突出理論和實(shí)踐相結(jié)合,可作為各類高等院校教材,也可供廣大程序設(shè)計人員參考。
本書由北京百里半網(wǎng)絡(luò)技術(shù)有限公司和李平老師編著。本書編者長期從事項(xiàng)目開發(fā)和教學(xué)實(shí)施,并且對當(dāng)前高校的教學(xué)情況非常熟悉,在編寫過程中充分考慮到不同學(xué)生的特點(diǎn)和需求,加強(qiáng)了項(xiàng)目實(shí)戰(zhàn)方面的教學(xué)。在本書的編寫過程中,得到了武漢厚溥教育科技有限公司各級領(lǐng)導(dǎo)的大力支持,在此對他們表示衷心的感謝。
北京百里半網(wǎng)絡(luò)技術(shù)有限公司,武漢厚溥企業(yè)集團(tuán)成員單位,致力于互聯(lián)網(wǎng)相關(guān)信息技術(shù)產(chǎn)品和服務(wù)的研究與開發(fā),以及在線教育行業(yè)產(chǎn)品、服務(wù)的集成運(yùn)營。公司擁有雄厚的具備學(xué)術(shù)、教育及產(chǎn)業(yè)背景的研發(fā)團(tuán)隊。
公司為政府、高校、企業(yè)等提供極具競爭力的產(chǎn)品服務(wù)。在人工智能、大數(shù)據(jù)及IT運(yùn)維、互聯(lián)網(wǎng)用戶行為分析、在線教育等領(lǐng)域推出了自有知識產(chǎn)權(quán)的獨(dú)特而領(lǐng)先的產(chǎn)品,為公司的持續(xù)發(fā)展奠定了堅實(shí)的基礎(chǔ)。
北京百里半網(wǎng)絡(luò)技術(shù)有限公司長期以來堅持并弘揚(yáng)“以人為本,本在心;以厚為道,道在行。創(chuàng)造機(jī)遇,成就潛能。IT成就**潛能”的企業(yè)文化,努力成為值得客戶信賴的、具有獨(dú)特價值的優(yōu)秀企業(yè),并使之基業(yè)長青。
李平,男,1981年出生,工學(xué)博士,任教于黃岡師范學(xué)院數(shù)學(xué)與統(tǒng)計學(xué)院。主要研究方向?yàn)榇髷?shù)據(jù)技術(shù)與應(yīng)用、數(shù)學(xué)建模等,有豐富的高校教學(xué)經(jīng)驗(yàn)與企業(yè)實(shí)踐經(jīng)歷,發(fā)表科研論文十余篇,主持參與省部級科研項(xiàng)目三項(xiàng),多次指導(dǎo)本專科學(xué)生及研究生參加數(shù)據(jù)挖掘競賽、數(shù)學(xué)建模競賽并獲得***獎項(xiàng)。
第1章 大數(shù)據(jù)概述
1.1 大數(shù)據(jù)與數(shù)據(jù)分析
1.1.1 Hadoop的基礎(chǔ)組件
1.1.2 Hadoop分布式文件系統(tǒng)
1.1.3 MapReduce
1.1.4 YARN
1.2 ZooKeeper
1.3 HiVe
1.4 與其他系統(tǒng)集成
1.4.1 Hadoop生態(tài)系統(tǒng)
1.4.2 數(shù)據(jù)集成與Hadoop
1.4.3 Hadoop商用平臺CDH
第2章 Hadoop存儲
2.1 HDFS的基礎(chǔ)知識
2.1.1 HDFS概念
2.1.2 架構(gòu)
2.1.3 接口
2.2 在分布式模式下設(shè)置HDFS集群
2.3 HDFS的高級特性
2.3.1 快照
2.3.2 離線查看器
2.3.3 分層存儲
2.4 文件格式
2.5 云存儲
第3章 數(shù)據(jù)倉庫和Hive
3.1 數(shù)據(jù)倉庫和Hive簡介
3.1.1 數(shù)據(jù)倉庫簡介
3.1.2 數(shù)據(jù)倉庫與數(shù)據(jù)庫的區(qū)別
3.1.3 Hive簡介
3.1.4 查看CDH中Hive版本
3.2 Hive與數(shù)據(jù)庫
3.2.1 Hive與RDBMS
3.2.2 HiveQL與SQL
3.3 Hive的高級特性
3.3.1 Hive的優(yōu)缺點(diǎn)和適用場景
3.3.2 Hive進(jìn)程介紹
3.3.3 Hive訪問方式
3.3.4 Hive體系結(jié)構(gòu)
3.3.5 HiveMetastore
3.3.6 Hive數(shù)據(jù)類型
3.3.7 Hive的常用參數(shù)配置
3.3.8 Hive的數(shù)據(jù)模型
3.3.9 Hive函數(shù)
3.4 案例演示
3.4.1 準(zhǔn)備數(shù)據(jù)
3.4.2 修改和查詢
3.4.3 表連接
3.4.4 創(chuàng)建視圖
3.4.5 創(chuàng)建索引
3.4.6 JDBC開發(fā)
3.4.7 UDF的開發(fā)
3.4.8 UDAF
3.5 Hive優(yōu)化和Hive中的鎖
3.5.1 注意事項(xiàng)
3.5.2 Hive鎖
3.6 問題匯總
……
第4章 Hadoop計算
第5章 Hadoop安全
第6章 Flume分布式日志處理系統(tǒng)
第7章 Spark及其生態(tài)圈概述