王偉軍、劉蕤、周光有編*的《大數(shù)據(jù)分析》結(jié)合大數(shù)據(jù)分析實操和商務應用場景,以大數(shù)據(jù)分析流程為主線,按照“原理、方法、工具和應用”組織內(nèi)容體系,主要內(nèi)容包括:大數(shù)據(jù)生態(tài)系統(tǒng)和大數(shù)據(jù)分析的環(huán)境搭建、大數(shù)據(jù)收集、大數(shù)據(jù)計算、大數(shù)據(jù)挖掘、大數(shù)據(jù)可視化,通過在用戶搜索行為分析和個性化推薦系統(tǒng)兩個現(xiàn)實場景中的實驗,闡述并展示了大數(shù)據(jù)分析的環(huán)境配置和大數(shù)據(jù)分析的應用實例。
本書以附錄形式呈現(xiàn)大數(shù)據(jù)分析實驗環(huán)境搭建、Hadoop組件參數(shù)配置,以及大數(shù)據(jù)分析相關(guān)學習資源。此外,我們還制作了配套PPT課件、案例、習題、試卷及答案等電子資源,以及實驗所用完整數(shù)據(jù),方便讀者動手實踐書中所講解的實例。
本書適合于電子商務、信息管理與信息系統(tǒng)及相關(guān)專業(yè)的大學生和研究生學習,以及對大數(shù)據(jù)分析感興趣和有志于從事數(shù)據(jù)分析工作的讀者閱讀使用。
第1章大數(shù)據(jù)概述
1.1大數(shù)據(jù)的背景
1.2大數(shù)據(jù)的基本概念
1.3大數(shù)據(jù)的來源及分類
1.4大數(shù)據(jù)分析的價值
1.5案例:上海聯(lián)通大數(shù)據(jù)應用實踐
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復習思考題】
第2章大數(shù)據(jù)生態(tài)系統(tǒng)
2.1.Hadoop生態(tài)系統(tǒng)
2.2Spark生態(tài)系統(tǒng)
2.3Hadoop和Spark的應用案例
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復習思考題】
第3章大數(shù)據(jù)收集
3.1Flume
3.2Kafka
3.3Kafka和Flume的區(qū)別
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復習思考題】
第4章大數(shù)據(jù)計算
4.1MapReduce
4.2Impala
4.3Stolln
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復習思考題】
第5章大數(shù)據(jù)挖掘
5.1機器學習
5.2Mahout
5.3Weka
5.4R語言
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復習思考題】
第6章大數(shù)據(jù)可視化
6.1Tableau
6.2ECharts
6.3大數(shù)據(jù)可視化應用實例
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復習思考題】
第7章大規(guī)模搜索日志用戶行為分析
7.1Linux環(huán)境下進行數(shù)據(jù)預處理
7.2基于Hive構(gòu)建日志數(shù)據(jù)的數(shù)據(jù)倉庫
7.3搜索日志數(shù)據(jù)分析
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復習思考題】
第8章電子商務大數(shù)據(jù)推薦系統(tǒng)
8.1電子商務推薦系統(tǒng)
8.2數(shù)據(jù)預處理
8.3Mahout基于項目的推薦方法
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復習思考題】
附錄
附錄1Flume中組件的度量
附錄2Linux系統(tǒng)下配置實驗環(huán)境
附錄3安裝部署Hive
附錄4Mahout實驗環(huán)境配置及數(shù)據(jù)準備
附錄5大數(shù)據(jù)分析學習資源
參考文獻