本書以實戰(zhàn)案例為先導,協(xié)助讀者選定合適的大數(shù)據(jù)預處理工具和方法進行多源異構數(shù)據(jù)的集成、歸約和存儲,完成數(shù)據(jù)探索、數(shù)據(jù)分析過程和數(shù)據(jù)分析結果的可視化;針對敏感指標進行數(shù)據(jù)脫敏以及對大數(shù)據(jù)治理實施過程中產生的體系、方法、軟件、模型等進行歸納整理,形成知識庫。
本實訓教材共包含9個實訓。實訓1-7介紹了Linux的安裝和配置、Hadoop的安裝和配置、HDFS操作方法和基礎編程、HBase與Hive的安裝和配置、MapReduce基礎編程、Spark的安裝和配置、Hadoop開發(fā)環(huán)境的安裝和部署。實訓8和實訓9通過兩個綜合案例對全書進行了總結。每個實訓均設置了實訓目的、實訓要
本書試圖以基因為格,把基因的結構模型、復制機制、變異進化的原理和互聯(lián)網的鏈式傳導、指數(shù)增長、迭代創(chuàng)新等現(xiàn)象結合起來展開思考,觸類旁通,面向數(shù)字政府的場景,探討數(shù)字政府建設中的組織管理問題。使用督辦清單、分工清單、制度清單加強資源管理,以打造規(guī)范化、智能化、微活力的電子政務,促進電子政務這一新型辦公手段高效、精準為政為民
本書在內容編排上共設置五章:第一章基于大數(shù)據(jù)的內涵與發(fā)展、大數(shù)據(jù)的主要應用價值與挑戰(zhàn)、大數(shù)據(jù)時代及其特征方面詮釋大數(shù)據(jù)理論與大數(shù)據(jù)時代;第二章解讀大數(shù)據(jù)處理架構與技術,內容涵蓋大數(shù)據(jù)處理架構Hadoop及其生態(tài)系統(tǒng)、大數(shù)據(jù)處理架構SPSSModeler及其文本挖掘、大數(shù)據(jù)存儲與管理研究;第三章分析數(shù)據(jù)挖掘技術及其常用算
本書將現(xiàn)場總線控制技術與工程應用相結合,先簡單介紹了工業(yè)數(shù)據(jù)通信的基礎知識;再從工程應用角度出發(fā),以項目案例的形式介紹了CAN、PROFIBUS-DP/PA、工業(yè)以太網、PROFINETIO、AS-I等總線的規(guī)范、技術特點、組態(tài)方法,以及經典WinCCV7.3及TIAPortalWinCCV13組態(tài)軟件的特點、組態(tài)與應
本書詳細闡述了大數(shù)據(jù)領域數(shù)據(jù)采集與預處理的相關理論和技術。全書共8章,內容包括概述、大數(shù)據(jù)實驗環(huán)境搭建、網絡數(shù)據(jù)采集、分布式消息系統(tǒng)Kafka、日志采集系統(tǒng)Flume、數(shù)據(jù)倉庫中的數(shù)據(jù)集成、ETL工具Kettle、使用pandas進行數(shù)據(jù)清洗。本書在第3章至第8章中安排了豐富的實踐操作,以便讀者更好地學習和掌握數(shù)據(jù)采集
本書共分八章。章主要介紹語言、語法、句法的基本概念,也借此闡明筆者自己的觀點,交代句法分析的一般背景。第二章主要從句子定義、句子分類、詞在句中的格位變化以及句子結構成分間的語法關系與語法意義等幾個方面介紹阿拉伯傳統(tǒng)語語法學家的傳統(tǒng)句法觀,交代阿拉伯語傳統(tǒng)語法學家研究阿拉伯語句法的基本脈絡和基本內容,并做簡要評價。 第
本書以數(shù)據(jù)思維為主題,以數(shù)據(jù)分析全流程為主線,融合了與數(shù)據(jù)思維相關的編程語言、統(tǒng)計學基礎及案例分析等內容,全書分為4篇,囊括了數(shù)據(jù)思維的概念和培養(yǎng)方法、數(shù)據(jù)來源及體系建設、數(shù)據(jù)分析三大思維方式及用戶流失、用戶轉化實戰(zhàn)等共11章的內容。本書囊括了數(shù)據(jù)分析中常用的分析方法,包括經典的海盜(AARRR)模型、麥肯錫的MECE
本書參照教育部計算機基礎課程實驗教學的基本要求,主要介紹信息技術及其應用,從基礎原理出發(fā)、以具體應用為導向進行數(shù)據(jù)處理講解。全書共三部分:第一部分(第1~4章)為數(shù)據(jù)處理基礎,介紹數(shù)據(jù)獲取以及基本的數(shù)據(jù)處理方法,包括使用軟件、瀏覽器插件等工具爬取數(shù)據(jù),Excel電子表格數(shù)據(jù)處理和圖像數(shù)據(jù)處理;第二部分(第5~8章)為數(shù)
本書面向大數(shù)據(jù)技術專業(yè),遵循知識性、實用性、系統(tǒng)性、條理性、連貫性和先進性的原則,力求激發(fā)讀者的興趣,注重實踐性環(huán)節(jié)教學,注重各知識點之間的銜接,精心組織內容,做到由淺入深、突出重點。本章共9章,第1章為Spark基礎,主要包括Spark基礎知識、Spark應用場景以及Spark生態(tài)系統(tǒng)等內容;第2章為Scala語言基