本書以Python作為開發(fā)Spark應(yīng)用程序的編程語言,系統(tǒng)介紹了Spark編程的基礎(chǔ)知識。全書共9章,內(nèi)容包括大數(shù)據(jù)技術(shù)概述、Spark的設(shè)計與運行原理、大數(shù)據(jù)實驗環(huán)境搭建、Spark環(huán)境搭建和使用方法、RDD編程、SparkSQL、SparkStreaming、StructuredStreaming和SparkML
這是一本理論高度概括的書,講解流式處理核心、本質(zhì)的概念、特性、設(shè)計和方法。本書分為兩部分:第一部分以Beam的編程模型為抓手討論流處理的種種核心問題,重點是相對高層次地討論批處理模型以及流處理模型;第二部分討論流與表的二象性,即兩者之間的類比與差異,對概念進行深入探討,并討論關(guān)于流處理的“流與表”的思考方式。本書還概要
大數(shù)據(jù)技術(shù)基礎(chǔ)
本書詳細講解了基于微服務(wù)的數(shù)據(jù)工程應(yīng)用開發(fā)實踐,包括微服務(wù)及數(shù)據(jù)工程相關(guān)原理概述、開發(fā)環(huán)境搭建、服務(wù)運行與跟蹤、服務(wù)通信與配置、國產(chǎn)自主可控數(shù)據(jù)庫實踐、相關(guān)系統(tǒng)的開發(fā)實踐等內(nèi)容,特色是(1)結(jié)合當今微服務(wù)發(fā)展技術(shù)指導傳統(tǒng)數(shù)據(jù)工程應(yīng)用的開發(fā)實踐(2)引入當今對國產(chǎn)自主可控數(shù)據(jù)庫的要求,詳細講解了如何在微服務(wù)技術(shù)條件下對國
《數(shù)據(jù)資產(chǎn)管理核心技術(shù)與應(yīng)用》深入探討數(shù)據(jù)資產(chǎn)管理的核心技術(shù)與應(yīng)用,融入作者在大數(shù)據(jù)領(lǐng)域多年的豐富經(jīng)驗!稊(shù)據(jù)資產(chǎn)管理核心技術(shù)與應(yīng)用》為讀者提供一套可以落地的數(shù)據(jù)資產(chǎn)管理框架,并詳解兩個基于該框架進行數(shù)據(jù)資產(chǎn)管理的應(yīng)用案例,使讀者能更好地了解數(shù)據(jù)資產(chǎn)管理底層所涉及的眾多核心技術(shù),讓數(shù)據(jù)可以發(fā)揮出更大的價值。《數(shù)據(jù)資產(chǎn)管
本書系統(tǒng)介紹了大數(shù)據(jù)基礎(chǔ)知識和相關(guān)技術(shù),全書分為大數(shù)據(jù)基礎(chǔ)、大數(shù)據(jù)存儲與管理篇、大數(shù)據(jù)采集與預處理、大數(shù)據(jù)分析與挖掘、大數(shù)據(jù)平臺Hadoop實踐與應(yīng)用案例5篇,共17章,主要內(nèi)容包括大數(shù)據(jù)基本概念、大數(shù)據(jù)平臺Hadoop基礎(chǔ)、大數(shù)據(jù)存儲與管理基本概念、大數(shù)據(jù)分布式文件系統(tǒng)HDFS、大數(shù)據(jù)分布式數(shù)據(jù)庫系統(tǒng)HBase、大數(shù)
《Hadoop海量數(shù)據(jù)處理》從Hadoop的基礎(chǔ)知識講起,逐步深入Hadoop分布式文件系統(tǒng)(HDFS)和MapReduce分布式編程框架的核心技術(shù),幫助讀者全面、系統(tǒng)、深入地理解Hadoop海量數(shù)據(jù)處理技術(shù)的精髓。本書在講解技術(shù)原理時穿插大量的典型示例,并詳解兩個典型項目實戰(zhàn)案例,幫助讀者提高實際項目開發(fā)水平!禜a
本書通過魯棒優(yōu)化的核心原理和應(yīng)用,揭開不確定性的神秘面紗,為讀者提供應(yīng)對不可預測的挑戰(zhàn)所需的見解和工具。作者首先簡要介紹了不確定線性規(guī)劃,然后深入分析了適當不確定性集的構(gòu)建與經(jīng)典機會約束(概率)方法之間的相互聯(lián)系。接著,提出了針對不確定的錐二次優(yōu)化和半定優(yōu)化問題以及動態(tài)(多階段)問題的魯棒優(yōu)化理論。最后,通過來自金融、
本書針對本科生控制理論課程中的典型難點問題開展了針對性的研究,包括物理建模、實驗辨識建模、動態(tài)誤差系數(shù)法、時滯系統(tǒng)穩(wěn)定性分析、描述函數(shù)法、串聯(lián)校正、狀態(tài)反饋和最優(yōu)控制數(shù)值解法等內(nèi)容。書中給出了典型案例的Matlab源程序及Simulink模型。通過對本書的學習,讀者能夠?qū)刂评碚撚懈忧逦陌盐,提高編程能力?/p>
機器學習應(yīng)用需要大量的數(shù)據(jù),因此有必要保護這些數(shù)據(jù)集中敏感信息的隱私和安全。從數(shù)據(jù)收集和導入到模型開發(fā)和部署,隱私保護發(fā)生在機器學習過程中的每個環(huán)節(jié)。這本實用的圖書將講授確保數(shù)據(jù)管道端到端安全所需的技能。 《隱私保護機器學習》通過面部識別、云數(shù)據(jù)存儲等真實世界中的用例來探討隱私保護技術(shù)。你將了解到現(xiàn)在就可以部署的切實