本書共4個項目15個任務,項目由易到難、從單一到綜合,各個項目間既有機聯系又相互獨立,授課教師可以根據所教學生的學情分析結果選擇某一個項目單獨教學并進行任務實施。4個項目分別是:安裝環(huán)境準備、Hadoop集群完全分布式部署、Hadoop生態(tài)系統(tǒng)常用組件部署、HadoopHA集群部署。每個項目的任務都包含了任務目標、知識
在諸如上市公司財務風險預測等多源異構數據場景中,多智能體系統(tǒng)憑借其獨特的群智決策優(yōu)勢受到高度關注,具有廣闊的應用前景。與此同時,由于人工智能黑箱現象的普遍存在,人們在理解、管理和信任智能系統(tǒng)過程中面臨十分嚴峻的問題。因此,如何增強多智能體系統(tǒng)決策支持的可解釋性成為十分重要而富有挑戰(zhàn)性的前沿課題之一。本書結合認知心理學中
本書系統(tǒng)介紹了MATLABR2022a仿真軟件在自動控制領域的功能亮點和MATLAB編程基礎,由淺入深地介紹了基于Simulink模塊編程的仿真系統(tǒng)搭建與分析方法。本書第1章介紹了MATLAB基礎知識;第2章闡述了經典控制理論中的數學建模、時域分析、根軌跡分析、頻域分析、系統(tǒng)校正與設計和非線性控制系統(tǒng)分析等關鍵理論與M
實體識別在數據質量管理中起著重要作用,它是數據質量管理的重要研究方向。實體識別的目的是識別出數據集中描述同一真實世界實體的元組。實體識別的結果可以在數據質量管理的其他階段(如數據清洗階段和數據質量評估階段)得到廣泛應用。在一個或多個數據庫中,同一個現實世界實體可能具有多種描述方式,這一問題在各種應用領域的信息系統(tǒng)中普遍
本書在R語言和Python的基礎上開發(fā)了基于云計算的可視化云平臺。全書內容包括:大數據分析基礎、簡單數據挖掘、基本統(tǒng)計方法、統(tǒng)計分析模型、時間序列預測技術、多元決策分析方法、大數據分析進階七章。
"數據科學項目日益增多,每個項目在提出原型到生產的過程中都需要可靠的基礎設施。使用《Effective數據科學基礎設施》介紹的一些新技術和新工具,你將能建立一個適用于各類組織(無論是初創(chuàng)企業(yè)還是大型企業(yè))的基礎設施堆棧!禘ffective數據科學基礎設施》可幫助你建立數據流程和項目工作流,為你開發(fā)項目帶來強大動力!
從什么是數據,數據與優(yōu)化的關系入手,以經典的傳統(tǒng)數據分析方法和最新的深度學習算法為例,系統(tǒng)介紹了數據分析的算法設計思想及實現方法。內容涉及了數據的可視化、特征選擇與降維、神經網絡基本原理、無監(jiān)督學習、有監(jiān)督學習、深度學習的魯棒性等,全書提供了豐富的實例以及完整的可實現的Pyth從什么是數據,數據與優(yōu)化的關系入手,以經典
本書以Hadoop3.3.0為核心,涵蓋Hadoop生態(tài)系統(tǒng)的常用組件,主要介紹各組件的架構原理、Shell命令、常用API及編程等,并配有較多例題。全書共7章,內容包含Hadoop概述、Hadoop偽分布式安裝、Hadoop分布式文件系統(tǒng)HDFS、分布式計算框架MapReduce、分布式數據庫HBase、數據倉庫Hi
本書由校企“雙元”合作開發(fā),以企業(yè)真實項目的實施流程為主線,通過“電商平臺用戶行為數據分析”項目實戰(zhàn),貫穿Hadoop大數據核心技術,包括項目需求、大數據平臺部署、數據采集、離線數據倉庫設計與開發(fā)和項目數據可視化展示。本書內容主要涉及VMware、Xshell、IDEA等軟件的安裝配置;Hadoop分布式集群環(huán)境搭建;
《大數據應用基礎教程》旨在培養(yǎng)大學低年級本科生的大數據應用能力,使其初步建立數據思維,以滿足“新工科”“新醫(yī)科”“新農科”“新文科”建設背景下高校培養(yǎng)學生數據素養(yǎng)能力的新要求。全書共3篇;A篇(第1、2章)主要內容為大數據概述、Python及常用類庫;數據分析篇(第3~7章)重點闡述數據獲取、存儲、預處理、可視化和分