這是一部從云原生角度講解數(shù)據(jù)中臺的業(yè)務(wù)價值、產(chǎn)品形態(tài)、架構(gòu)設(shè)計、技術(shù)選型、落地方法論、實施路徑和行業(yè)案例的著作,得到了國內(nèi)外企業(yè)界和學(xué)術(shù)界的技術(shù)專家一致好評。
本書的作者曾在硅谷的Twitter等企業(yè)從事大數(shù)據(jù)平臺的建設(shè)工作多年,隨后又成功創(chuàng)辦了國內(nèi)領(lǐng)先的以云原生數(shù)據(jù)中臺為核心技術(shù)和產(chǎn)品的企業(yè)。他們將在硅谷的大數(shù)據(jù)平臺建設(shè)經(jīng)驗與在國內(nèi)的數(shù)據(jù)中臺建設(shè)經(jīng)驗進行深度融合,并系統(tǒng)闡述了云原生架構(gòu)對數(shù)據(jù)中臺的必要性及其相關(guān)實踐,對國內(nèi)企業(yè)的中臺建設(shè)和運營具有很高的參考價值。
全書共18章,分為四個部分:
第1部分(第1~4章) 數(shù)據(jù)中臺與硅谷大數(shù)據(jù)平臺
首先,從起源、定義、能力、應(yīng)用場景、建設(shè)目標(biāo)、建設(shè)方法論總綱等角度對數(shù)據(jù)中臺做了全面的介紹;其次,講解了數(shù)據(jù)中臺如何驅(qū)動數(shù)字化轉(zhuǎn)型;Z后,通過對硅谷的Twitter等獨角獸企業(yè)的數(shù)據(jù)平臺和國內(nèi)的數(shù)據(jù)中臺進行對比,給出了這兩種架構(gòu)之間的異同點。核心內(nèi)容是讓讀者透徹理解數(shù)據(jù)中臺對于業(yè)務(wù)的價值。
第二部分(第5~8章) 數(shù)據(jù)中臺架構(gòu)與方法論
結(jié)合硅谷的數(shù)據(jù)平臺的架構(gòu)方法,講解了數(shù)據(jù)中臺的架構(gòu)方法和9大原則、數(shù)據(jù)中臺建設(shè)的全套準(zhǔn)備工作和系統(tǒng)方法論,以及云原生架構(gòu)與數(shù)據(jù)中臺的融合。
第三部分(第9~15章)數(shù)據(jù)中臺技術(shù)選型與核心內(nèi)容
首先,全方位地介紹了建設(shè)數(shù)據(jù)中臺時如何進行技術(shù)選型,然后重點講解了數(shù)據(jù)湖、數(shù)據(jù)倉庫、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)流水線管理、數(shù)據(jù)中臺應(yīng)用開發(fā)、數(shù)據(jù)門戶等數(shù)據(jù)中臺建設(shè)的核心內(nèi)容。
第四部分(第16~18章)數(shù)據(jù)中臺案例分析
通過游戲、零售、物聯(lián)網(wǎng)3個領(lǐng)域的案例講解了數(shù)據(jù)中臺的搭建、實現(xiàn)與運營。
(1)作者在Twitter等硅谷獨角獸企業(yè)有多年大數(shù)據(jù)平臺架構(gòu)與開發(fā)經(jīng)驗,同時又在國內(nèi)有數(shù)年數(shù)據(jù)中臺建設(shè)經(jīng)驗,本書在內(nèi)容上對這兩方面的經(jīng)驗進行了充分比較和深度融合。
(2)本書得到了武漢大學(xué)計算機學(xué)院前院長、FaceBook和Twitter前工程總監(jiān)、明略科技副總裁等多位國內(nèi)外學(xué)術(shù)界和企業(yè)界專家的一致好評。
(3)從云原生角度切入,全面講解云原生數(shù)據(jù)中臺的架構(gòu)、技術(shù)選型、落地方法論、實施路徑和行業(yè)案例。
【免費視頻課】作者親授數(shù)字化能力與平臺構(gòu)建,搭配圖書學(xué)習(xí)效果更佳!
獲取方式:
1、微信關(guān)注華章計算機
2、在后臺回復(fù)關(guān)鍵詞:舞動數(shù)字
數(shù)據(jù)中臺的概念從剛剛提出時的火熱到近的降溫,似乎已經(jīng)加速走過了Gartner技術(shù)成熟度曲線的一半周期:從出現(xiàn),到受吹捧,到遭質(zhì)疑,再到進入低谷。數(shù)據(jù)中臺將逐漸消失,還是在成熟后成為像數(shù)據(jù)倉庫一樣的數(shù)據(jù)基礎(chǔ)架構(gòu)?終的答案當(dāng)然要由市場給出,但我們想在本書中基于我們的經(jīng)驗與思考,介紹數(shù)據(jù)中臺出現(xiàn)的根本原因、它在實現(xiàn)數(shù)據(jù)價值中的關(guān)鍵作用以及它的建設(shè)方式。
對于數(shù)據(jù)的價值,在大數(shù)據(jù)概念普及多年后的今天,大家應(yīng)該是普遍認(rèn)可的。我一直都在從事與數(shù)據(jù)相關(guān)的工作和研究,1996年在武漢大學(xué)跟隨何炎祥老師做分布式數(shù)據(jù)挖掘方面的研究,2000年在美國馬里蘭大學(xué)做流式數(shù)據(jù)引擎相關(guān)的探索,2005年加入Ask.com做分布式操作系統(tǒng)的數(shù)據(jù)存儲工作。2008年大數(shù)據(jù)概念出現(xiàn),我在Ask.com做了一個非常明智的決定使用開源的Hadoop(而不是我們內(nèi)部的分布式操作系統(tǒng))替代日益昂貴、不堪重負(fù)的Oracle數(shù)據(jù)倉庫,雖然我們的內(nèi)部系統(tǒng)比Hadoop快一個數(shù)量級。替換了Oracle之后,我們還基于Hadoop平臺開發(fā)了一系列數(shù)據(jù)驅(qū)動的產(chǎn)品,滿足了不斷增長的數(shù)據(jù)產(chǎn)品需求。2011年,我加入Twitter并負(fù)責(zé)大數(shù)據(jù)流水線的建設(shè),我在實踐中看到公司如何從數(shù)據(jù)中獲取價值,實現(xiàn)整個企業(yè)的數(shù)據(jù)驅(qū)動。與此同時,我也與硅谷其他公司同行進行了廣泛的探討,這些使我堅定了自己的認(rèn)識:未來的企業(yè)一定是數(shù)據(jù)驅(qū)動的企業(yè),未來的大數(shù)據(jù)一定會和Word、Excel、數(shù)據(jù)庫一樣,成為企業(yè)運營人員的必備技能。
雖然數(shù)據(jù)的價值得到普遍認(rèn)可,企業(yè)數(shù)字化轉(zhuǎn)型的必要性也是大部分CEO的共識,但業(yè)界對一個關(guān)鍵問題的看法還遠沒有達成一致:數(shù)據(jù)中臺是不是支撐企業(yè)數(shù)字化轉(zhuǎn)型的合理的數(shù)據(jù)基礎(chǔ)架構(gòu)?在我們與國內(nèi)企業(yè)交流的時候,很多企業(yè)的CEO、CIO仍對數(shù)據(jù)中臺到底應(yīng)該是什么形態(tài)有不少疑問。與之不同的是,硅谷的大多數(shù)知名獨角獸公司有與數(shù)據(jù)中臺架構(gòu)相似的數(shù)據(jù)基礎(chǔ)架構(gòu),即數(shù)據(jù)平臺(Data Platform),并以此作為企業(yè)數(shù)字化運營的基礎(chǔ)。這些數(shù)據(jù)平臺雖然沒有被稱為中臺,但卻包含了我們通常認(rèn)為中臺需要承載的任務(wù):打通企業(yè)各個部門之間的數(shù)據(jù),形成統(tǒng)一的數(shù)據(jù)開發(fā)和使用規(guī)范,在企業(yè)各個部門之間實現(xiàn)數(shù)據(jù)能力的抽象、共享和復(fù)用。因此,本書試圖找到這些數(shù)據(jù)平臺的架構(gòu)與國內(nèi)普遍認(rèn)可的數(shù)據(jù)中臺架構(gòu)之間的通用理念,并從對業(yè)務(wù)的實際需求層面探討這些架構(gòu)設(shè)計理念的合理性和必要性。
與傳統(tǒng)技術(shù)中間件不一樣,數(shù)據(jù)中臺雖然也是承接底層數(shù)據(jù)和上層業(yè)務(wù)的中間層,但它的價值更多體現(xiàn)在與業(yè)務(wù)結(jié)合的能力矩陣,而不是簡單的數(shù)據(jù)標(biāo)準(zhǔn)化和報表工具上。各個業(yè)務(wù)部門可以使用不同的技術(shù)中間件,這樣雖然效率可能低一些,但是同樣可以滿足業(yè)務(wù)的要求。然而,分割的數(shù)據(jù)層無法對核心業(yè)務(wù)流程進行全局還原和支持,無法實現(xiàn)數(shù)據(jù)驅(qū)動的全局決策和產(chǎn)品研發(fā)。與傳統(tǒng)的數(shù)據(jù)倉庫受事前建模的限制不一樣,數(shù)據(jù)中臺一般使用數(shù)據(jù)湖來存儲可以反映全局業(yè)務(wù)情況的原始數(shù)據(jù),能夠?qū)诵臉I(yè)務(wù)流程進行更全面、更深入的分析,并在此基礎(chǔ)上加快對市場的認(rèn)識和反應(yīng),降低產(chǎn)品研發(fā)和試錯的成本,縮短時間。因此,定義好業(yè)務(wù)能力矩陣,讓業(yè)務(wù)部門看到數(shù)據(jù)中臺實現(xiàn)從0到1的關(guān)鍵數(shù)據(jù)能力,將大數(shù)據(jù)平臺從成本中心變成利潤中心,應(yīng)該是每個企業(yè)建設(shè)數(shù)據(jù)中臺的目標(biāo)。
除了確定對于業(yè)務(wù)的價值之外,建設(shè)數(shù)據(jù)中臺的一個根本問題是技術(shù)架構(gòu)的選擇及設(shè)計。我在Twitter架構(gòu)師委員會擔(dān)任負(fù)責(zé)大數(shù)據(jù)平臺的架構(gòu)師期間,每個星期都會參加由CTO組織的產(chǎn)品架構(gòu)評審和討論會。這些會議給我留下深印象的不是對各種前沿技術(shù)的討論,也不是架構(gòu)設(shè)計中的技術(shù)難點攻關(guān),而是技術(shù)架構(gòu)對業(yè)務(wù)的重大影響。很多時候,我們看到一個快速發(fā)展的業(yè)務(wù)因為早期架構(gòu)設(shè)計的問題而難以迭代,或者企業(yè)的發(fā)展受限于IT部門的效率。而一個高效的架構(gòu)能夠解放業(yè)務(wù)部門的生產(chǎn)力,真正賦能業(yè)務(wù)人員去完成以前想都不敢想的任務(wù)。其實數(shù)據(jù)中臺這個概念會在國內(nèi)出現(xiàn),很大程度上也是因為架構(gòu)的問題。試想一下,如果我們在設(shè)計大數(shù)據(jù)平臺的時候就已經(jīng)考慮到了消除數(shù)據(jù)孤島、應(yīng)用孤島,統(tǒng)一數(shù)據(jù)規(guī)范,那么還需要單獨建設(shè)一個數(shù)據(jù)中臺嗎?
因此,我們在本書中討論了云原生架構(gòu)對于數(shù)據(jù)中臺的必要性。數(shù)據(jù)中臺的一個天然特性是支持多元異構(gòu)的數(shù)據(jù)以及處理這些數(shù)據(jù)的工具。雖然很多時候孤島的產(chǎn)生有組織架構(gòu)的原因,但是缺乏統(tǒng)一的數(shù)據(jù)平臺,無法快速支持不同部門對數(shù)據(jù)的不同需求,這些也是產(chǎn)生孤島的重要原因因為業(yè)務(wù)部門需要不斷建設(shè)獨立的系統(tǒng)以滿足眼前的緊迫需求。在Twitter的大數(shù)據(jù)平臺建設(shè)過程中,公司規(guī)模從300人發(fā)展到4000人,集群規(guī)模從80臺服務(wù)器擴展到8000臺服務(wù)器,利用云原生架構(gòu)我們快速滿足了各個部門對不同數(shù)據(jù)的需求,并極大簡化了統(tǒng)一數(shù)據(jù)規(guī)范的工作。各個業(yè)務(wù)部門可以快速自主地在平臺上開發(fā)自己的數(shù)據(jù)應(yīng)用,很少需要額外的系統(tǒng)支持,從而大大降低了出現(xiàn)孤島的可能性。隨著云平臺及容器技術(shù)的不斷成熟,我們認(rèn)為云原生架構(gòu)一定是未來數(shù)據(jù)平臺建設(shè)的必然選擇。
當(dāng)然,選擇一個合適的技術(shù)架構(gòu)只是數(shù)據(jù)中臺建設(shè)的開始,明確了終目標(biāo)也不能保證實施一定會成功,我們還需要清晰的實施路徑和可落實的方法論。例如:建設(shè)數(shù)據(jù)中臺是否需要改變組織架構(gòu)?如何進行頂層設(shè)計以及管理實施迭代?我們認(rèn)為,雖然數(shù)據(jù)中臺是一個復(fù)雜的項目,但是其建設(shè)流程是非常明確和可控制的。與業(yè)務(wù)中臺建設(shè)一般需要與業(yè)務(wù)組織架構(gòu)對齊不同,數(shù)據(jù)中臺建設(shè)很少要求對現(xiàn)有業(yè)務(wù)流程進行大的改動,它的目的是深刻理解當(dāng)前的業(yè)務(wù)流程,提出優(yōu)化建議并提供能力支持。因此,數(shù)據(jù)中臺落地應(yīng)該采取業(yè)務(wù)驅(qū)動、快速落地、小步快跑的方式,而不是一開始就做一把大而全的鑰匙。在這個過程中,使用合適的指標(biāo)體系衡量數(shù)據(jù)中臺的投入產(chǎn)出比,以及提供合適的工具賦能業(yè)務(wù)部門,有助于數(shù)據(jù)中臺得到業(yè)務(wù)部門的支持和認(rèn)可,順利完成中臺的實施。在本書中,我們根據(jù)自己的經(jīng)驗和業(yè)界的一些成功實踐對數(shù)據(jù)中臺建設(shè)方法論進行了深入的探討,希望能對讀者有所幫助。
1995年,我作為一名程序員參與了中國農(nóng)業(yè)銀行武漢分行辦公自動化系統(tǒng)的建設(shè),此后25年,我有幸在國內(nèi)和美國硅谷見證了IT技術(shù)為企業(yè)帶來的運營效率的巨大提升。雖然一直在一線,參與了很多有挑戰(zhàn)的技術(shù)工作,但是讓我收獲的還是作為企業(yè)技術(shù)管理者和數(shù)據(jù)負(fù)責(zé)人,與CEO、CMO、CIO一起探討如何用數(shù)據(jù)為企業(yè)產(chǎn)生價值,以及作為架構(gòu)師來推動OA、數(shù)據(jù)倉庫、ERP、CRM、大數(shù)據(jù)、人工智能在企業(yè)的各種復(fù)雜場景中的落地。對這兩個方面進行交叉審視,可以發(fā)現(xiàn)技術(shù)架構(gòu)和業(yè)務(wù)能力間的獨特連接:二者看似沒有必然的因果關(guān)系,但在深層次上業(yè)務(wù)能力永遠是技術(shù)架構(gòu)的推動力、決策者和買單方。從這個角度來講,數(shù)據(jù)庫的出現(xiàn)解決了交易的問題,數(shù)據(jù)倉庫的出現(xiàn)解決了關(guān)系型數(shù)據(jù)高維度的深度分析問題,大數(shù)據(jù)的出現(xiàn)解決了海量異構(gòu)數(shù)據(jù)的存儲和分析問題,而數(shù)據(jù)中臺的出現(xiàn)是為了解決業(yè)務(wù)打通和提供全局?jǐn)?shù)據(jù)能力的問題。數(shù)據(jù)庫、數(shù)據(jù)倉庫、大數(shù)據(jù)已經(jīng)成為企業(yè)IT架構(gòu)不可或缺的部分,我們認(rèn)為,無論數(shù)據(jù)中臺這個名稱是否會繼續(xù)存在,它所涉及的問題都是企業(yè)的數(shù)據(jù)基礎(chǔ)架構(gòu)必須解決的。因此,本書重點討論了對于業(yè)務(wù)需求和架構(gòu)設(shè)計而言數(shù)據(jù)中臺這個概念出現(xiàn)的必然性,也深入介紹了架構(gòu)選擇與業(yè)務(wù)需求之間的聯(lián)系,試圖為正在解決這些問題的企業(yè)和機構(gòu)提供一些架構(gòu)設(shè)計和落地方案上的參考。
本書是智領(lǐng)云團隊協(xié)作的結(jié)晶,除了署名的三位作者之外,產(chǎn)品經(jīng)理王龍飛、王純、黃艷以及設(shè)計師龔清、市場部劉丹等也在本書的內(nèi)容組織、圖片設(shè)計方面做了大量工作。此外,非常感謝機械工業(yè)出版社華章公司的編輯楊福川和羅詞亮,他們在本書的寫作過程中提供了大量的幫助和反饋,讓我們得以順利完成本書的寫作。
希望本書能在應(yīng)對數(shù)字化轉(zhuǎn)型挑戰(zhàn)方面為讀者提供一些思路和參考,感謝大家的支持。
彭鋒
2021年4月
彭鋒
智領(lǐng)云科技聯(lián)合創(chuàng)始人兼CEO
武漢大學(xué)計算機系本科及碩士,美國馬里蘭大學(xué)計算機專業(yè)博士,主要研究方向是流式半結(jié)構(gòu)化數(shù)據(jù)的高性能查詢引擎,在數(shù)據(jù)庫會議和期刊SIGMOD、ICDE、TODS上發(fā)表多篇開創(chuàng)性論文。
2005年加入世界五百強企業(yè)IAC Ask.com,任分布式系統(tǒng)及大數(shù)據(jù)工程總監(jiān),負(fù)責(zé)研發(fā)分布式操作系統(tǒng)及中間件,以及集團大數(shù)據(jù)平臺的建設(shè)。2011年加入Twitter,任大數(shù)據(jù)平臺主任工程師、公司架構(gòu)師委員會大數(shù)據(jù)負(fù)責(zé)人,負(fù)責(zé)公司大數(shù)據(jù)平臺及流水線的建設(shè)和管理。作為硅谷天使投資人,曾投資硅谷多家大數(shù)據(jù)相關(guān)初創(chuàng)企業(yè),并擔(dān)任技術(shù)指導(dǎo)和行業(yè)顧問。2016年回國聯(lián)合創(chuàng)立智領(lǐng)云科技有限公司。
宋文欣
智領(lǐng)云科技聯(lián)合創(chuàng)始人兼CTO
武漢大學(xué)計算機系本科及碩士,美國紐約州立大學(xué)石溪分校計算機專業(yè)博士。曾先后就職于Ask.com和EA(電子藝界)。在Ask.com期間,擔(dān)任大數(shù)據(jù)部門技術(shù)負(fù)責(zé)人及工程經(jīng)理,使用Hadoop集群處理實時搜索數(shù)據(jù),形成全球第1大Search Ads Arbitrage用戶;在EA期間,擔(dān)任數(shù)字平臺部門高級研發(fā)經(jīng)理,從無到有組建EA數(shù)據(jù)平臺團隊,建設(shè)公司大數(shù)據(jù)平臺,為EA全球工作室提供數(shù)據(jù)能力支持。
2016年回國聯(lián)合創(chuàng)立智領(lǐng)云科技有限公司,組建智領(lǐng)云技術(shù)團隊,開發(fā)了BDOS大數(shù)據(jù)平臺操作系統(tǒng)。
孫浩峰
智領(lǐng)云科技市場總監(jiān)
前CSDN內(nèi)容運營副總編,負(fù)責(zé)網(wǎng)站內(nèi)容和商務(wù)合作、新媒體方面事宜,關(guān)注云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等技術(shù)領(lǐng)域,對云計算、網(wǎng)絡(luò)技術(shù)、網(wǎng)絡(luò)存儲有深刻認(rèn)識。擁有豐富的媒體從業(yè)經(jīng)驗和專業(yè)的網(wǎng)絡(luò)安全技術(shù)功底,具有超過15年的企業(yè)級IT市場傳播、推廣、宣傳和寫作經(jīng)驗,撰寫過多篇在業(yè)界具有一定影響力的文章。
前言
部分 數(shù)據(jù)中臺與硅谷大數(shù)據(jù)平臺
第1章 全面了解數(shù)據(jù)中臺
1.1 數(shù)據(jù)中臺概念的起源 3
1.1.1 藝電的數(shù)據(jù)中臺改造 4
1.1.2 Twitter的數(shù)據(jù)驅(qū)動 6
1.2 什么是數(shù)據(jù)中臺 8
1.2.1 數(shù)據(jù)中臺建設(shè)的目標(biāo) 8
1.2.2 如何實現(xiàn)數(shù)據(jù)中臺建設(shè)的目標(biāo) 11
1.2.3 數(shù)據(jù)中臺的定義和4個特點 13
1.3 大數(shù)據(jù)平臺與數(shù)據(jù)中臺 16
1.3.1 為什么要建設(shè)數(shù)據(jù)中臺 16
1.3.2 數(shù)據(jù)中臺與傳統(tǒng)大數(shù)據(jù)平臺的區(qū)別 20
1.3.3 數(shù)據(jù)中臺的評判標(biāo)準(zhǔn) 24
1.4 數(shù)據(jù)中臺建設(shè)方法論總綱 24
1.5 本章小結(jié) 27
第2章 數(shù)據(jù)中臺能力和應(yīng)用場景
2.1 數(shù)據(jù)中臺不是銀彈 28
2.2 數(shù)據(jù)中臺的核心能力 31
2.2.1 全局商業(yè)洞見 31
2.2.2 個性化服務(wù) 34
2.2.3 實時數(shù)據(jù)報表 38
2.2.4 共享能力開發(fā)新業(yè)務(wù) 39
2.3 數(shù)據(jù)中臺的行業(yè)應(yīng)用場景 41
2.3.1 互聯(lián)網(wǎng)行業(yè) 41
2.3.2 連鎖零售業(yè) 42
2.3.3 金融業(yè) 43
2.3.4 物聯(lián)網(wǎng) 44
2.4 數(shù)據(jù)中臺如何為企業(yè)賦能 45
2.4.1 組織架構(gòu) 46
2.4.2 決策部門 48
2.4.3 業(yè)務(wù)部門 51
2.4.4 研發(fā)部門 53
2.4.5 大數(shù)據(jù)部門 55
2.5 本章小結(jié) 56
第3章 數(shù)據(jù)中臺與數(shù)字化轉(zhuǎn)型
3.1 數(shù)字化轉(zhuǎn)型的4個階段 58
3.1.1 信息化 58
3.1.2 數(shù)據(jù)倉庫(數(shù)據(jù)平臺1.0) 59
3.1.3 大數(shù)據(jù)平臺(數(shù)據(jù)平臺2.0) 61
3.1.4 數(shù)據(jù)中臺(數(shù)據(jù)平臺3.0) 63
3.2 數(shù)據(jù)驅(qū)動 64
3.2.1 面向用戶的數(shù)據(jù)驅(qū)動產(chǎn)品及服務(wù) 66
3.2.2 面向內(nèi)部業(yè)務(wù)部門的數(shù)據(jù)驅(qū)動服務(wù) 68
3.2.3 數(shù)據(jù)驅(qū)動的系統(tǒng)管理 71
3.3 數(shù)據(jù)中臺如何支持?jǐn)?shù)字化轉(zhuǎn)型 72
3.3.1 從技術(shù)層面支持?jǐn)?shù)字化轉(zhuǎn)型 73
3.3.2 從組織架構(gòu)層面支持?jǐn)?shù)字化轉(zhuǎn)型 74
3.4 本章小結(jié) 75
第4章 從大數(shù)據(jù)平臺到數(shù)據(jù)中臺
4.1 大數(shù)據(jù)平臺建設(shè)階段 76
4.1.1 大數(shù)據(jù)平臺起步 77
4.1.2 系統(tǒng)自動化 77
4.1.3 大數(shù)據(jù)平臺的生產(chǎn)化 78
4.2 數(shù)據(jù)管理及應(yīng)用階段 80
4.2.1 數(shù)據(jù)湖/數(shù)據(jù)倉庫建設(shè) 80
4.2.2 數(shù)據(jù)管理 81
4.2.3 數(shù)據(jù)安全 82
4.3 數(shù)據(jù)能力中臺化階段 84
4.3.1 全局的數(shù)據(jù)治理 85
4.3.2 數(shù)據(jù)能力的復(fù)用和共享 85
4.3.3 云原生架構(gòu)的支撐 85
4.4 DataOps 87
4.4.1 什么是DataOps 87
4.4.2 DataOps解決的問題 88
4.4.3 DataOps的目標(biāo)功能 90
4.4.4 DataOps的主要技術(shù) 91
4.4.5 DataOps與數(shù)據(jù)中臺 92
4.5 本章小結(jié) 93
第二部分 數(shù)據(jù)中臺架構(gòu)與方法論
第5章 數(shù)據(jù)中臺建設(shè)須知
5.1 數(shù)據(jù)中臺建設(shè)需要一套方法論 96
5.2 從失敗的大數(shù)據(jù)項目中吸取教訓(xùn) 98
5.3 數(shù)據(jù)中臺建設(shè)中的常見問題 99
5.4 評判數(shù)據(jù)中臺建設(shè)效果 101
5.5 數(shù)據(jù)中臺建設(shè)的人員規(guī)劃 103
5.6 數(shù)據(jù)中臺的技術(shù)選型要求 106
5.7 本章小結(jié) 107
第6章 數(shù)據(jù)中臺建設(shè)方法論
6.1 基礎(chǔ)架構(gòu) 109
6.2 數(shù)據(jù)工具 114
6.3 頂層架構(gòu)設(shè)計 115
6.4 數(shù)據(jù)規(guī)范 116
6.5 業(yè)務(wù)驅(qū)動 118
6.6 關(guān)鍵指標(biāo) 120
6.7 明確責(zé)權(quán)利 125
6.8 管理迭代 127
6.9 數(shù)據(jù)中臺建設(shè)流程 128
6.10 本章小結(jié) 130
第7章 數(shù)據(jù)中臺的架構(gòu)
7.1 數(shù)據(jù)中臺的功能定位 132
7.2 數(shù)據(jù)中臺架構(gòu)設(shè)計的9大原則 135
7.3 典型的硅谷大數(shù)據(jù)平臺架構(gòu) 137
7.3.1 Twitter的大數(shù)據(jù)平臺架構(gòu) 137
7.3.2 Airbnb的大數(shù)據(jù)平臺架構(gòu) 140
7.3.3 Uber的大數(shù)據(jù)平臺架構(gòu) 141
7.3.4 云平臺作為大數(shù)據(jù)平臺的通用底座 143
7.3.5 硅谷大數(shù)據(jù)平臺架構(gòu)的共性和建設(shè)思路 145
7.4 數(shù)據(jù)中臺架構(gòu) 147
7.5 數(shù)據(jù)中臺子系統(tǒng) 150
7.5.1 應(yīng)用基礎(chǔ)能力平臺 151
7.5.2 數(shù)據(jù)基礎(chǔ)能力平臺 152
7.5.3 數(shù)據(jù)集成開發(fā)平臺 154
7.5.4 數(shù)據(jù)資產(chǎn)運營平臺 156
7.5.5 數(shù)據(jù)業(yè)務(wù)能力層 158
7.5.6 數(shù)據(jù)中臺重點建設(shè)內(nèi)容 159
7.6 本章小結(jié) 160
第8章 數(shù)據(jù)中臺與云原生架構(gòu)
8.1 云原生架構(gòu)及云平臺 161
8.2 PaaS平臺的主要功能 165
8.2.1 資源管理 167
8.2.2 應(yīng)用全生命周期管理 169
8.2.3 高可用和容錯 170
8.2.4 運維平臺 172
8.3 傳統(tǒng)方式下搭建數(shù)據(jù)中臺的難點 173
8.4 云原生架構(gòu)對于數(shù)據(jù)中臺建設(shè)的5大意義 175
8.5 數(shù)據(jù)中臺的IaaS層選擇 178
8.6 本章小結(jié) 180
第三部分 數(shù)據(jù)中臺技術(shù)選型與核心內(nèi)容
第9章 數(shù)據(jù)中臺建設(shè)與開源軟件
9.1 開源軟件的起源和建設(shè)過程 185
9.2 開源軟件的合理使用 189
9.3 集成開源軟件的5個注意事項 192
9.4 應(yīng)用基礎(chǔ)能力平臺的開源選擇 193
9.5 數(shù)據(jù)基礎(chǔ)能力平臺的開源選擇 196
9.6 數(shù)據(jù)集成開發(fā)平臺的開源選擇 203
9.7 本章小結(jié) 205
第10章 數(shù)據(jù)湖與數(shù)據(jù)倉庫
10.1 數(shù)據(jù)湖 207
10.1.1 數(shù)據(jù)湖的起源與作用 208
10.1.2 數(shù)據(jù)湖建設(shè)的4個目標(biāo) 211
10.1.3 數(shù)據(jù)湖數(shù)據(jù)的采集和存儲 212
10.1.4 數(shù)據(jù)湖中的數(shù)據(jù)治理 216
10.2 數(shù)據(jù)倉庫 218
10.2.1 數(shù)據(jù)建模方式 219
10.2.2 數(shù)據(jù)倉庫建設(shè)的層次 221
10.2.3 數(shù)據(jù)倉庫中的數(shù)據(jù)治理 225
10.2.4 數(shù)據(jù)清洗 229
10.3 數(shù)據(jù)中臺中的數(shù)據(jù)倉庫和數(shù)據(jù)湖建設(shè) 231
10.4 本章小結(jié) 233
第11章 數(shù)據(jù)資產(chǎn)管理
11.1 數(shù)據(jù)資產(chǎn)管理的難題 235
11.2 數(shù)據(jù)資產(chǎn)管理定義 238
11.3 主數(shù)據(jù)管理 239
11.4 元數(shù)據(jù)管理 242
11.4.1 元數(shù)據(jù)的分類 243
11.4.2 元數(shù)據(jù)管理系統(tǒng)的功能 245
11.5 開源的元數(shù)據(jù)管理系統(tǒng) 247
11.6 數(shù)據(jù)資產(chǎn)的ROI 249
11.7 本章小結(jié) 250
第12章 數(shù)據(jù)流水線管理
12.1 數(shù)據(jù)流水線的定義與模型 251
12.2 數(shù)據(jù)流水線中的應(yīng)用類別 254
12.3 數(shù)據(jù)流水線的運行方式 256
12.4 數(shù)據(jù)流水線示例 257
12.5 數(shù)據(jù)流水線管理系統(tǒng)面臨的挑戰(zhàn) 259
12.6 數(shù)據(jù)流水線管理系統(tǒng)的功能需求 262
12.6.1 自動化流水線 262
12.6.2 數(shù)據(jù)管理 263
12.6.3 性能要求 264
12.7 數(shù)據(jù)流水線管理系統(tǒng)的組件 265
12.8 批流合一的數(shù)據(jù)流水線 266
12.9 本章小結(jié) 269
第13章 數(shù)據(jù)中臺應(yīng)用開發(fā)
13.1 數(shù)據(jù)應(yīng)用的形態(tài) 270
13.2 應(yīng)用開發(fā)工具 277
13.3 3種典型的數(shù)據(jù)中臺應(yīng)用 279
13.3.1 數(shù)據(jù)即服務(wù) 279
13.3.2 模型即服務(wù) 281
13.3.3 用戶標(biāo)簽系統(tǒng) 282
13.4 數(shù)據(jù)中臺應(yīng)用的開發(fā)和管理 283
13.4.1 應(yīng)用調(diào)度系統(tǒng) 284
13.4.2 多租戶管理 285
13.4.3 持續(xù)集成和發(fā)布 286
13.5 本章小結(jié) 287
第14章 數(shù)據(jù)門戶
14.1 數(shù)據(jù)門戶出現(xiàn)的背景 288
14.2 硅谷的數(shù)據(jù)門戶建設(shè) 289
14.2.1 Twitter的DAL和EagleEye 290
14.2.2 LinkedIn的Data Hub 292
14.2.3 Airbnb的Data Portal 293
14.2.4 Lyft的Amundsen 294
14.2.5 Netflix的Metacat 296
14.2.6 Intuit的SuperGlue 297
14.2.7 硅谷數(shù)據(jù)門戶總結(jié) 298
14.3 數(shù)據(jù)門戶的定位及功能 299
14.4 數(shù)據(jù)門戶的實現(xiàn)原理 301
14.5 數(shù)據(jù)門戶的社交屬性 303
14.6 數(shù)據(jù)應(yīng)用的自助及協(xié)同工作 304
14.7 數(shù)據(jù)智能運維 306
14.8 本章小結(jié) 308
第15章 管理數(shù)據(jù)中臺的演進
15.1 不斷演進的數(shù)據(jù)中臺 310
15.2 人員變動下的數(shù)據(jù)管理 310
15.2.1 數(shù)據(jù)安全 311
15.2.2 數(shù)據(jù)能力的傳遞 312
15.3 數(shù)據(jù)和應(yīng)用的演進 314
15.4 資源的演進 316
15.5 演進中的關(guān)鍵指標(biāo) 318
15.6 本章小結(jié) 321
第四部分 數(shù)據(jù)中臺案例分析
第16章 EA數(shù)據(jù)中臺實踐
16.1 建設(shè)背景 324
16.2 組織架構(gòu)調(diào)整 327
16.3 建設(shè)過程 328
16.4 體系架構(gòu) 333
16.5 數(shù)據(jù)治理 336
16.5.1 數(shù)據(jù)標(biāo)準(zhǔn)和規(guī)范 336
16.5.2 元數(shù)據(jù)管理 338
16.5.3 數(shù)據(jù)質(zhì)量管理 339
16.6 數(shù)據(jù)應(yīng)用產(chǎn)品 340
16.6.1 推薦系統(tǒng) 340
16.6.2 打造動態(tài)游戲體驗 341
16.6.3 標(biāo)簽系統(tǒng)及游戲運營 343
16.7 EA數(shù)據(jù)中臺功能總結(jié) 344
16.8 本章小結(jié) 345
第17章 零售行業(yè)的數(shù)據(jù)中臺
17.1 零售行業(yè)的數(shù)字化轉(zhuǎn)型 346
17.2 零售行業(yè)數(shù)據(jù)中臺解決方案 347
17.3 零售行業(yè)數(shù)據(jù)中臺的建設(shè) 349
17.3.1 數(shù)據(jù)匯聚 350
17.3.2 業(yè)務(wù)調(diào)研 352
17.3.3 數(shù)據(jù)倉庫建設(shè)及數(shù)據(jù)分析 354
17.3.4 業(yè)務(wù)系統(tǒng)的能力反饋 356
17.4 零售行業(yè)數(shù)據(jù)中臺的應(yīng)用場景 357
17.4.1 用戶標(biāo)簽體系 357
17.4.2 精準(zhǔn)市場營銷 359
17.5 本章小結(jié) 361
第18章 物聯(lián)網(wǎng)領(lǐng)域數(shù)據(jù)中臺建設(shè)
18.1 現(xiàn)代物聯(lián)網(wǎng)的產(chǎn)業(yè)鏈 362
18.2 物聯(lián)網(wǎng)與ABC 365
18.3 物聯(lián)網(wǎng)數(shù)據(jù)中臺架構(gòu) 366
18.4 智慧建筑物聯(lián)網(wǎng)數(shù)據(jù)中臺應(yīng)用 371
18.5 本章小結(jié) 374