關(guān)于我們
書單推薦
新書推薦
|
Spark 3.0大數(shù)據(jù)分析與挖掘:基于機器學(xué)習(xí)
Spark作為新興的、應(yīng)用范圍廣泛的大數(shù)據(jù)處理開源框架,吸引了大量的大數(shù)據(jù)分析與挖掘從業(yè)人員進(jìn)行相關(guān)內(nèi)容的學(xué)習(xí)與開發(fā),其中ML是Spark 3.0機器學(xué)習(xí)框架使用的核心。本書用于Spark 3.0 ML大數(shù)據(jù)分析與挖掘入門,配套示例源碼、PPT課件、數(shù)據(jù)集、思維導(dǎo)圖、開發(fā)環(huán)境和作者答疑服務(wù)。
本書共分13章,從Spark 3.0大數(shù)據(jù)分析概述、基礎(chǔ)安裝和配置開始,依次介紹ML的DataFrame、ML的基本概念,以及協(xié)同過濾、線性回歸、分類、決策樹與隨機森林、聚類、關(guān)聯(lián)規(guī)則、數(shù)據(jù)降維、特征提取和轉(zhuǎn)換等數(shù)據(jù)處理方法;最后通過經(jīng)典的鳶尾花分析實例,回顧前面的學(xué)習(xí)內(nèi)容,實現(xiàn)了一個完整的數(shù)據(jù)分析與挖掘過程。 本書采取實例和理論相結(jié)合的方式,講解細(xì)致直觀,示例豐富,適合Spark 3.0機器學(xué)習(xí)初學(xué)者、大數(shù)據(jù)分析和挖掘人員,也適合高等院校和培訓(xùn)機構(gòu)人工智能與大數(shù)據(jù)相關(guān)專業(yè)的師生教學(xué)參考。
你還可能感興趣
我要評論
|