影音先锋每日av色资源站,亚洲综合欧美色五月俺也去,国产一区二区电影

內(nèi)容簡介
編輯推薦
序言
作者介紹
目錄

主要內(nèi)容

·大數(shù)據(jù)技術(shù)和Spark概述。

·通過實例學(xué)習(xí)DataFrame、SQL、Dataset等Spark的核心API。

·了解Spark的低級API實現(xiàn)，包括RDD以及SQL和DataFrame的執(zhí)行過程。

·了解Spark如何在集群上運行。

·Spark集群和應(yīng)用程序的調(diào)試、監(jiān)控、和調(diào)優(yōu)。

·學(xué)習(xí)Spark強大的流處理引擎——結(jié)構(gòu)化流處理。

·學(xué)習(xí)MLlib并了解如何應(yīng)用它解決包括分類、推薦，以及其他多種實際問題。

通過本書你將了解到如何使用、部署和維護Apache Spark開源集群計算框架。本書由Spark的創(chuàng)始人所撰寫，重點介紹Spark新版本的新功能和新特點。本書將Spark功能分解為若干獨立主題來進行全面介紹。

你將接觸到Spark的基本操作和常用函數(shù)，還包括一種全新的構(gòu)建端到端流數(shù)據(jù)應(yīng)用的結(jié)構(gòu)化流處理API。開發(fā)人員和系統(tǒng)管理員將了解到Spark的監(jiān)控、調(diào)優(yōu)，以及調(diào)試的原則和方法，并通過使用Spark提供的可擴展機器學(xué)習(xí)庫Mllib來了解機器學(xué)習(xí)算法的實現(xiàn)技術(shù)。

作者介紹

Bill Chambers是Databricks的一名產(chǎn)品經(jīng)理，致力于使用Spark和Databricks幫助客戶完成大規(guī)模數(shù)據(jù)分析的任務(wù)。Bill還定期寫關(guān)于數(shù)據(jù)科學(xué)和大數(shù)據(jù)方面的博客, 并常在各種會議和見面會上展示產(chǎn)品。他擁有加州大學(xué)伯克利分校信息學(xué)院的信息系統(tǒng)碩士學(xué)位, 研究方向為數(shù)據(jù)科學(xué)。

Matei Zaharia是斯坦福大學(xué)計算機科學(xué)系助理教授和Databricks的首席技術(shù)官。他于2009年在加州大學(xué)伯克利分校創(chuàng)立了Spark項目, 那時他是一名博士生, 并繼續(xù)擔(dān)任Apache Spark項目的副主席。Matei Zaharia還是Apache Mesos項目的聯(lián)合創(chuàng)始人，也是Apache Hadoop項目的貢獻者。Matei Zaharia以他出色的研究工作獲得了2014年美國計算機學(xué)會博士論文獎和VMware系統(tǒng)研究獎。

譯者介紹

張巖峰，東北大學(xué)教授，在國內(nèi)外從事大數(shù)據(jù)分布式處理研究工作10余年，中國計算機學(xué)會數(shù)據(jù)庫專委會委員，大數(shù)據(jù)專委會通訊委員，研究設(shè)計了iMapReduce、Maiter等大數(shù)據(jù)迭代計算分布式框架，承擔(dān)和參與國家自然科學(xué)基金、國家重點研發(fā)計劃等多項課題，在SIGMOD、VLDB、ICDE、PPoPP、TPDS、TKDE等頂D級國際會議和期刊上發(fā)表論文10余篇，曾獲云計算國際會議ACM SOCC 2011優(yōu)秀論文獎及多項國內(nèi)外獎勵和榮譽。

你還可能感興趣

Spark SQL入門與實踐指南
HCIA-Big Data學(xué)習(xí)指南
動態(tài)數(shù)據(jù)驅(qū)動應(yīng)用系統(tǒng)指南
數(shù)據(jù)資產(chǎn)評估指南
數(shù)據(jù)戰(zhàn)略實踐手冊
Spark權(quán)威指南

我要評論

您的姓名	驗證碼：
留言內(nèi)容