本書(shū)系統(tǒng)梳理總結(jié)ApacheHadoop大數(shù)據(jù)相關(guān)技術(shù),介紹大數(shù)據(jù)存儲(chǔ)、并行計(jì)算、數(shù)據(jù)處理等內(nèi)容,幫助讀者形成對(duì)大數(shù)據(jù)知識(shí)體系及其應(yīng)用領(lǐng)域的輪廓性認(rèn)識(shí),為讀者在大數(shù)據(jù)領(lǐng)域進(jìn)行更深入的學(xué)習(xí)和研究奠定基礎(chǔ)、指明方向。
本書(shū)基礎(chǔ)理論和案例分析相結(jié)合,全面介紹了大數(shù)據(jù)技術(shù)的基礎(chǔ)知識(shí),以提升讀者對(duì)大數(shù)據(jù)的認(rèn)知。全書(shū)共11章,內(nèi)容包括大數(shù)據(jù)概述、大數(shù)據(jù)時(shí)代的思維變革、大數(shù)據(jù)的采集與存儲(chǔ)、數(shù)據(jù)可視化、支撐大數(shù)據(jù)的技術(shù)、商業(yè)大數(shù)據(jù)、民生大數(shù)據(jù)、工業(yè)大數(shù)據(jù)、政務(wù)大數(shù)據(jù)、安全大數(shù)據(jù)和大數(shù)據(jù)的未來(lái)。本書(shū)既可作為全國(guó)高等學(xué)校計(jì)算機(jī)及相關(guān)專(zhuān)業(yè)“大數(shù)據(jù)導(dǎo)論
《精通Hadoop3》詳細(xì)闡述了與Hadoop3相關(guān)的基礎(chǔ)知識(shí),主要包括Hadoop3簡(jiǎn)介、深入理解Hadoop分布式文件系統(tǒng)、YARN資源管理器、MapReduce內(nèi)部機(jī)制、Hadoop中的SQL、實(shí)時(shí)處理引擎、Hadoop生態(tài)圈組件、定義Hadoop中的應(yīng)用程序、Hadoop中的實(shí)時(shí)流處理、Hadoop中的機(jī)器學(xué)習(xí)
本書(shū)是大數(shù)據(jù)教育系列教材之一。本書(shū)的主要內(nèi)容包括:認(rèn)識(shí)大數(shù)據(jù)、大數(shù)據(jù)技術(shù)基礎(chǔ)、大數(shù)據(jù)治理、大數(shù)據(jù)統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、大數(shù)據(jù)可視化、大數(shù)據(jù)安全、大數(shù)據(jù)應(yīng)用案例實(shí)操(零售、互聯(lián)網(wǎng)、金融保險(xiǎn)、制造、網(wǎng)絡(luò)游戲、廣告、旅游等)等。本書(shū)編寫(xiě)是以國(guó)運(yùn)數(shù)據(jù)自主研發(fā)的大數(shù)據(jù)分析工具——“魔鏡”為平臺(tái),理論結(jié)合實(shí)踐,通過(guò)具體案例介紹如何進(jìn)
數(shù)據(jù)分析是指用適當(dāng)?shù)臄?shù)學(xué)方法對(duì)收集來(lái)的大量數(shù)據(jù)進(jìn)行分析,以求最大化地開(kāi)發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)分析是為了提取有用信息和形成結(jié)論而對(duì)數(shù)據(jù)加以詳細(xì)研究及概括總結(jié)的過(guò)程。數(shù)據(jù)分析的目的在于把隱藏在一大批看來(lái)雜亂無(wú)章的數(shù)據(jù)中的信息集中、萃取和提煉出來(lái)。 數(shù)據(jù)科學(xué)是高等學(xué)校非計(jì)算機(jī)專(zhuān)業(yè)本科學(xué)生必修的一門(mén)公共基礎(chǔ)課程,
保障和促進(jìn)“新基建”的健康發(fā)展,重點(diǎn)在于建立健全以數(shù)據(jù)為中心的治理法治化架構(gòu)與體系。本書(shū)緊緊圍繞新基建與數(shù)據(jù)治理法治化的各方面展開(kāi),主要論及新基建與數(shù)據(jù)權(quán)屬治理、數(shù)據(jù)競(jìng)爭(zhēng)治理、數(shù)據(jù)綠色治理、數(shù)據(jù)跨境流動(dòng)治理、數(shù)據(jù)安全發(fā)展治理等方面的現(xiàn)實(shí)問(wèn)題與潛在風(fēng)險(xiǎn),在此基礎(chǔ)上提出了相應(yīng)對(duì)策和治理方案。
本書(shū)沿著時(shí)間的軌跡,講述了物理世界中宇宙和地球的誕生與演變,探討了生物世界中生命和人類(lèi)的誕生與進(jìn)化,討論了數(shù)字世界中科學(xué)技術(shù)的產(chǎn)生與進(jìn)步。數(shù)據(jù)與物質(zhì)和能量并駕齊驅(qū),構(gòu)成了人類(lèi)宇宙的三個(gè)基本要素,并以此為基礎(chǔ)建立了物理、生物和數(shù)字三個(gè)各有千秋卻密切相連的世界!叭齻(gè)世界”的概念和框架構(gòu)成了本書(shū)討論數(shù)據(jù)智能的基礎(chǔ),為認(rèn)識(shí)、
《數(shù)據(jù)挖掘原理(第4版)》解釋、探索了數(shù)據(jù)挖掘的主要技術(shù),可以從數(shù)據(jù)中自動(dòng)提取隱式和潛在有用的信息。數(shù)據(jù)挖掘越來(lái)越多地用于商業(yè)、科學(xué)和其他應(yīng)用領(lǐng)域,它側(cè)重于分類(lèi)、關(guān)聯(lián)規(guī)則挖掘和聚類(lèi)。書(shū)中對(duì)每個(gè)主題都進(jìn)行了清晰的解釋?zhuān)攸c(diǎn)是算法而不是數(shù)學(xué)公式,并通過(guò)詳細(xì)的有效示例加以說(shuō)明。本書(shū)是為沒(méi)有強(qiáng)數(shù)學(xué)或統(tǒng)計(jì)學(xué)背景的讀者寫(xiě)的,并詳細(xì)
本書(shū)理論聯(lián)系實(shí)際,配以大量實(shí)例,系統(tǒng)地介紹了大數(shù)據(jù)有關(guān)的基礎(chǔ)知識(shí)。全書(shū)共分10章,內(nèi)容包括大數(shù)據(jù)概述,大數(shù)據(jù)、云計(jì)算與物聯(lián)網(wǎng),大數(shù)據(jù)架構(gòu)與Hadoop,數(shù)據(jù)采集與預(yù)處理,大數(shù)據(jù)分析與大數(shù)據(jù)挖掘,數(shù)據(jù)存儲(chǔ)與HDFS,MapReduce,數(shù)據(jù)可視化,大數(shù)據(jù)安全,大數(shù)據(jù)應(yīng)用案例。本書(shū)主要作為本科和高職高專(zhuān)相關(guān)專(zhuān)業(yè)的教材,也可
大數(shù)據(jù)分析與挖掘已經(jīng)廣泛應(yīng)用于各行各業(yè)。本書(shū)以項(xiàng)目實(shí)踐為基礎(chǔ),對(duì)大數(shù)據(jù)分析與挖掘的基礎(chǔ)知識(shí)進(jìn)行了介紹,總結(jié)了機(jī)器學(xué)習(xí)、大數(shù)據(jù)分析與挖掘過(guò)程、數(shù)據(jù)分析挖掘框架和庫(kù),分析了當(dāng)前的研究熱點(diǎn)與前沿技術(shù)。為了增強(qiáng)本書(shū)的實(shí)用性、提高讀者的動(dòng)手能力,本書(shū)結(jié)合案例討論了爬蟲(chóng)與數(shù)據(jù)處理、Echarts和Python可視化、描述性分析、并