書單推薦 新書推薦 |
Hive數據倉庫應用教程
本書將Hive相關技術分為9個項目,對Hive數據倉庫的應用進行了詳細的描述。項目一認識Hive,主要介紹數據倉庫的概念、特點、模型、體系結構,以及Hive的概念、體系結構、數據類型等內容。項目二Hive環(huán)境搭建,主要介紹搭建Hive的過程,包括虛擬機軟件工具的使用方法;Linux鏡像文件的安裝、克隆、啟動;Linux中的網絡環(huán)境設置;Hadoop環(huán)境的搭建;Hive的搭建等內容。項目三Hive基本語法,主要介紹了Hive的常用數據類型、運算符與表達式、Hive的數據存儲方式、常用的交互命令和其他操作命令。項目四Hive數據定義,主要介紹數據庫、數據表、分區(qū)表、分桶表、視圖、索引的創(chuàng)建、查看、修改和刪除等操作。項目五數據的導入與導出,主要介紹通過直接加載、Load加載、查詢加載、Import加載等方式導入數據,以及通過Insert命令、Hadoop命令、HiveShell命令等方式導出數據的方法。項目六Hive數據查詢,主要介紹Hive數據庫的基本查詢、條件查詢、分組、連接、排序等語句,以及隨機抽樣查詢等操作。項目七Hive函數,主要介紹了內置函數的應用,包括算術函數、聚合函數、日期時間函數、條件函數以及字符串函數,Hive其他常見函數以及自定義函數的應用。項目八Hive優(yōu)化,主要介紹了本地模式、配MapReduce壓縮、配置Map和Reduce個數、合并小文件、聚合語句、連接語句、統(tǒng)計語句、行/列過濾等優(yōu)化方式。項目九綜合案例,通過對電商銷售大數據的分析,綜合應用前述所學知識完成Hive數據倉庫的建庫建表,已經完成各類電商數據的統(tǒng)計分析。
你還可能感興趣
我要評論
|