這是一部從云原生角度講解數(shù)據(jù)中臺的業(yè)務價值、產品形態(tài)、架構設計、技術選型、落地方法論、實施路徑和行業(yè)案例的著作,得到了國內外企業(yè)界和學術界的技術專家一致好評。
本書的作者曾在硅谷的Twitter等企業(yè)從事大數(shù)據(jù)平臺的建設工作多年,隨后又成功創(chuàng)辦了國內領先的以云原生數(shù)據(jù)中臺為核心技術和產品的企業(yè)。他們將在硅谷的大數(shù)據(jù)平臺建設經(jīng)驗與在國內的數(shù)據(jù)中臺建設經(jīng)驗進行深度融合,并系統(tǒng)闡述了云原生架構對數(shù)據(jù)中臺的必要性及其相關實踐,對國內企業(yè)的中臺建設和運營具有很高的參考價值。
全書共18章,分為四個部分:
第1部分(第1~4章) 數(shù)據(jù)中臺與硅谷大數(shù)據(jù)平臺
首先,從起源、定義、能力、應用場景、建設目標、建設方法論總綱等角度對數(shù)據(jù)中臺做了全面的介紹;其次,講解了數(shù)據(jù)中臺如何驅動數(shù)字化轉型;Z后,通過對硅谷的Twitter等獨角獸企業(yè)的數(shù)據(jù)平臺和國內的數(shù)據(jù)中臺進行對比,給出了這兩種架構之間的異同點。核心內容是讓讀者透徹理解數(shù)據(jù)中臺對于業(yè)務的價值。
第二部分(第5~8章) 數(shù)據(jù)中臺架構與方法論
結合硅谷的數(shù)據(jù)平臺的架構方法,講解了數(shù)據(jù)中臺的架構方法和9大原則、數(shù)據(jù)中臺建設的全套準備工作和系統(tǒng)方法論,以及云原生架構與數(shù)據(jù)中臺的融合。
第三部分(第9~15章)數(shù)據(jù)中臺技術選型與核心內容
首先,全方位地介紹了建設數(shù)據(jù)中臺時如何進行技術選型,然后重點講解了數(shù)據(jù)湖、數(shù)據(jù)倉庫、數(shù)據(jù)資產管理、數(shù)據(jù)流水線管理、數(shù)據(jù)中臺應用開發(fā)、數(shù)據(jù)門戶等數(shù)據(jù)中臺建設的核心內容。
第四部分(第16~18章)數(shù)據(jù)中臺案例分析
通過游戲、零售、物聯(lián)網(wǎng)3個領域的案例講解了數(shù)據(jù)中臺的搭建、實現(xiàn)與運營。
(1)作者在Twitter等硅谷獨角獸企業(yè)有多年大數(shù)據(jù)平臺架構與開發(fā)經(jīng)驗,同時又在國內有數(shù)年數(shù)據(jù)中臺建設經(jīng)驗,本書在內容上對這兩方面的經(jīng)驗進行了充分比較和深度融合。
(2)本書得到了武漢大學計算機學院前院長、FaceBook和Twitter前工程總監(jiān)、明略科技副總裁等多位國內外學術界和企業(yè)界專家的一致好評。
(3)從云原生角度切入,全面講解云原生數(shù)據(jù)中臺的架構、技術選型、落地方法論、實施路徑和行業(yè)案例。
【免費視頻課】作者親授數(shù)字化能力與平臺構建,搭配圖書學習效果更佳!
獲取方式:
1、微信關注華章計算機
2、在后臺回復關鍵詞:舞動數(shù)字
數(shù)據(jù)中臺的概念從剛剛提出時的火熱到近的降溫,似乎已經(jīng)加速走過了Gartner技術成熟度曲線的一半周期:從出現(xiàn),到受吹捧,到遭質疑,再到進入低谷。數(shù)據(jù)中臺將逐漸消失,還是在成熟后成為像數(shù)據(jù)倉庫一樣的數(shù)據(jù)基礎架構?終的答案當然要由市場給出,但我們想在本書中基于我們的經(jīng)驗與思考,介紹數(shù)據(jù)中臺出現(xiàn)的根本原因、它在實現(xiàn)數(shù)據(jù)價值中的關鍵作用以及它的建設方式。
對于數(shù)據(jù)的價值,在大數(shù)據(jù)概念普及多年后的今天,大家應該是普遍認可的。我一直都在從事與數(shù)據(jù)相關的工作和研究,1996年在武漢大學跟隨何炎祥老師做分布式數(shù)據(jù)挖掘方面的研究,2000年在美國馬里蘭大學做流式數(shù)據(jù)引擎相關的探索,2005年加入Ask.com做分布式操作系統(tǒng)的數(shù)據(jù)存儲工作。2008年大數(shù)據(jù)概念出現(xiàn),我在Ask.com做了一個非常明智的決定使用開源的Hadoop(而不是我們內部的分布式操作系統(tǒng))替代日益昂貴、不堪重負的Oracle數(shù)據(jù)倉庫,雖然我們的內部系統(tǒng)比Hadoop快一個數(shù)量級。替換了Oracle之后,我們還基于Hadoop平臺開發(fā)了一系列數(shù)據(jù)驅動的產品,滿足了不斷增長的數(shù)據(jù)產品需求。2011年,我加入Twitter并負責大數(shù)據(jù)流水線的建設,我在實踐中看到公司如何從數(shù)據(jù)中獲取價值,實現(xiàn)整個企業(yè)的數(shù)據(jù)驅動。與此同時,我也與硅谷其他公司同行進行了廣泛的探討,這些使我堅定了自己的認識:未來的企業(yè)一定是數(shù)據(jù)驅動的企業(yè),未來的大數(shù)據(jù)一定會和Word、Excel、數(shù)據(jù)庫一樣,成為企業(yè)運營人員的必備技能。
雖然數(shù)據(jù)的價值得到普遍認可,企業(yè)數(shù)字化轉型的必要性也是大部分CEO的共識,但業(yè)界對一個關鍵問題的看法還遠沒有達成一致:數(shù)據(jù)中臺是不是支撐企業(yè)數(shù)字化轉型的合理的數(shù)據(jù)基礎架構?在我們與國內企業(yè)交流的時候,很多企業(yè)的CEO、CIO仍對數(shù)據(jù)中臺到底應該是什么形態(tài)有不少疑問。與之不同的是,硅谷的大多數(shù)知名獨角獸公司有與數(shù)據(jù)中臺架構相似的數(shù)據(jù)基礎架構,即數(shù)據(jù)平臺(Data Platform),并以此作為企業(yè)數(shù)字化運營的基礎。這些數(shù)據(jù)平臺雖然沒有被稱為中臺,但卻包含了我們通常認為中臺需要承載的任務:打通企業(yè)各個部門之間的數(shù)據(jù),形成統(tǒng)一的數(shù)據(jù)開發(fā)和使用規(guī)范,在企業(yè)各個部門之間實現(xiàn)數(shù)據(jù)能力的抽象、共享和復用。因此,本書試圖找到這些數(shù)據(jù)平臺的架構與國內普遍認可的數(shù)據(jù)中臺架構之間的通用理念,并從對業(yè)務的實際需求層面探討這些架構設計理念的合理性和必要性。
與傳統(tǒng)技術中間件不一樣,數(shù)據(jù)中臺雖然也是承接底層數(shù)據(jù)和上層業(yè)務的中間層,但它的價值更多體現(xiàn)在與業(yè)務結合的能力矩陣,而不是簡單的數(shù)據(jù)標準化和報表工具上。各個業(yè)務部門可以使用不同的技術中間件,這樣雖然效率可能低一些,但是同樣可以滿足業(yè)務的要求。然而,分割的數(shù)據(jù)層無法對核心業(yè)務流程進行全局還原和支持,無法實現(xiàn)數(shù)據(jù)驅動的全局決策和產品研發(fā)。與傳統(tǒng)的數(shù)據(jù)倉庫受事前建模的限制不一樣,數(shù)據(jù)中臺一般使用數(shù)據(jù)湖來存儲可以反映全局業(yè)務情況的原始數(shù)據(jù),能夠對核心業(yè)務流程進行更全面、更深入的分析,并在此基礎上加快對市場的認識和反應,降低產品研發(fā)和試錯的成本,縮短時間。因此,定義好業(yè)務能力矩陣,讓業(yè)務部門看到數(shù)據(jù)中臺實現(xiàn)從0到1的關鍵數(shù)據(jù)能力,將大數(shù)據(jù)平臺從成本中心變成利潤中心,應該是每個企業(yè)建設數(shù)據(jù)中臺的目標。
除了確定對于業(yè)務的價值之外,建設數(shù)據(jù)中臺的一個根本問題是技術架構的選擇及設計。我在Twitter架構師委員會擔任負責大數(shù)據(jù)平臺的架構師期間,每個星期都會參加由CTO組織的產品架構評審和討論會。這些會議給我留下深印象的不是對各種前沿技術的討論,也不是架構設計中的技術難點攻關,而是技術架構對業(yè)務的重大影響。很多時候,我們看到一個快速發(fā)展的業(yè)務因為早期架構設計的問題而難以迭代,或者企業(yè)的發(fā)展受限于IT部門的效率。而一個高效的架構能夠解放業(yè)務部門的生產力,真正賦能業(yè)務人員去完成以前想都不敢想的任務。其實數(shù)據(jù)中臺這個概念會在國內出現(xiàn),很大程度上也是因為架構的問題。試想一下,如果我們在設計大數(shù)據(jù)平臺的時候就已經(jīng)考慮到了消除數(shù)據(jù)孤島、應用孤島,統(tǒng)一數(shù)據(jù)規(guī)范,那么還需要單獨建設一個數(shù)據(jù)中臺嗎?
因此,我們在本書中討論了云原生架構對于數(shù)據(jù)中臺的必要性。數(shù)據(jù)中臺的一個天然特性是支持多元異構的數(shù)據(jù)以及處理這些數(shù)據(jù)的工具。雖然很多時候孤島的產生有組織架構的原因,但是缺乏統(tǒng)一的數(shù)據(jù)平臺,無法快速支持不同部門對數(shù)據(jù)的不同需求,這些也是產生孤島的重要原因因為業(yè)務部門需要不斷建設獨立的系統(tǒng)以滿足眼前的緊迫需求。在Twitter的大數(shù)據(jù)平臺建設過程中,公司規(guī)模從300人發(fā)展到4000人,集群規(guī)模從80臺服務器擴展到8000臺服務器,利用云原生架構我們快速滿足了各個部門對不同數(shù)據(jù)的需求,并極大簡化了統(tǒng)一數(shù)據(jù)規(guī)范的工作。各個業(yè)務部門可以快速自主地在平臺上開發(fā)自己的數(shù)據(jù)應用,很少需要額外的系統(tǒng)支持,從而大大降低了出現(xiàn)孤島的可能性。隨著云平臺及容器技術的不斷成熟,我們認為云原生架構一定是未來數(shù)據(jù)平臺建設的必然選擇。
當然,選擇一個合適的技術架構只是數(shù)據(jù)中臺建設的開始,明確了終目標也不能保證實施一定會成功,我們還需要清晰的實施路徑和可落實的方法論。例如:建設數(shù)據(jù)中臺是否需要改變組織架構?如何進行頂層設計以及管理實施迭代?我們認為,雖然數(shù)據(jù)中臺是一個復雜的項目,但是其建設流程是非常明確和可控制的。與業(yè)務中臺建設一般需要與業(yè)務組織架構對齊不同,數(shù)據(jù)中臺建設很少要求對現(xiàn)有業(yè)務流程進行大的改動,它的目的是深刻理解當前的業(yè)務流程,提出優(yōu)化建議并提供能力支持。因此,數(shù)據(jù)中臺落地應該采取業(yè)務驅動、快速落地、小步快跑的方式,而不是一開始就做一把大而全的鑰匙。在這個過程中,使用合適的指標體系衡量數(shù)據(jù)中臺的投入產出比,以及提供合適的工具賦能業(yè)務部門,有助于數(shù)據(jù)中臺得到業(yè)務部門的支持和認可,順利完成中臺的實施。在本書中,我們根據(jù)自己的經(jīng)驗和業(yè)界的一些成功實踐對數(shù)據(jù)中臺建設方法論進行了深入的探討,希望能對讀者有所幫助。
1995年,我作為一名程序員參與了中國農業(yè)銀行武漢分行辦公自動化系統(tǒng)的建設,此后25年,我有幸在國內和美國硅谷見證了IT技術為企業(yè)帶來的運營效率的巨大提升。雖然一直在一線,參與了很多有挑戰(zhàn)的技術工作,但是讓我收獲的還是作為企業(yè)技術管理者和數(shù)據(jù)負責人,與CEO、CMO、CIO一起探討如何用數(shù)據(jù)為企業(yè)產生價值,以及作為架構師來推動OA、數(shù)據(jù)倉庫、ERP、CRM、大數(shù)據(jù)、人工智能在企業(yè)的各種復雜場景中的落地。對這兩個方面進行交叉審視,可以發(fā)現(xiàn)技術架構和業(yè)務能力間的獨特連接:二者看似沒有必然的因果關系,但在深層次上業(yè)務能力永遠是技術架構的推動力、決策者和買單方。從這個角度來講,數(shù)據(jù)庫的出現(xiàn)解決了交易的問題,數(shù)據(jù)倉庫的出現(xiàn)解決了關系型數(shù)據(jù)高維度的深度分析問題,大數(shù)據(jù)的出現(xiàn)解決了海量異構數(shù)據(jù)的存儲和分析問題,而數(shù)據(jù)中臺的出現(xiàn)是為了解決業(yè)務打通和提供全局數(shù)據(jù)能力的問題。數(shù)據(jù)庫、數(shù)據(jù)倉庫、大數(shù)據(jù)已經(jīng)成為企業(yè)IT架構不可或缺的部分,我們認為,無論數(shù)據(jù)中臺這個名稱是否會繼續(xù)存在,它所涉及的問題都是企業(yè)的數(shù)據(jù)基礎架構必須解決的。因此,本書重點討論了對于業(yè)務需求和架構設計而言數(shù)據(jù)中臺這個概念出現(xiàn)的必然性,也深入介紹了架構選擇與業(yè)務需求之間的聯(lián)系,試圖為正在解決這些問題的企業(yè)和機構提供一些架構設計和落地方案上的參考。
本書是智領云團隊協(xié)作的結晶,除了署名的三位作者之外,產品經(jīng)理王龍飛、王純、黃艷以及設計師龔清、市場部劉丹等也在本書的內容組織、圖片設計方面做了大量工作。此外,非常感謝機械工業(yè)出版社華章公司的編輯楊福川和羅詞亮,他們在本書的寫作過程中提供了大量的幫助和反饋,讓我們得以順利完成本書的寫作。
希望本書能在應對數(shù)字化轉型挑戰(zhàn)方面為讀者提供一些思路和參考,感謝大家的支持。
彭鋒
2021年4月
彭鋒
智領云科技聯(lián)合創(chuàng)始人兼CEO
武漢大學計算機系本科及碩士,美國馬里蘭大學計算機專業(yè)博士,主要研究方向是流式半結構化數(shù)據(jù)的高性能查詢引擎,在數(shù)據(jù)庫會議和期刊SIGMOD、ICDE、TODS上發(fā)表多篇開創(chuàng)性論文。
2005年加入世界五百強企業(yè)IAC Ask.com,任分布式系統(tǒng)及大數(shù)據(jù)工程總監(jiān),負責研發(fā)分布式操作系統(tǒng)及中間件,以及集團大數(shù)據(jù)平臺的建設。2011年加入Twitter,任大數(shù)據(jù)平臺主任工程師、公司架構師委員會大數(shù)據(jù)負責人,負責公司大數(shù)據(jù)平臺及流水線的建設和管理。作為硅谷天使投資人,曾投資硅谷多家大數(shù)據(jù)相關初創(chuàng)企業(yè),并擔任技術指導和行業(yè)顧問。2016年回國聯(lián)合創(chuàng)立智領云科技有限公司。
宋文欣
智領云科技聯(lián)合創(chuàng)始人兼CTO
武漢大學計算機系本科及碩士,美國紐約州立大學石溪分校計算機專業(yè)博士。曾先后就職于Ask.com和EA(電子藝界)。在Ask.com期間,擔任大數(shù)據(jù)部門技術負責人及工程經(jīng)理,使用Hadoop集群處理實時搜索數(shù)據(jù),形成全球第1大Search Ads Arbitrage用戶;在EA期間,擔任數(shù)字平臺部門高級研發(fā)經(jīng)理,從無到有組建EA數(shù)據(jù)平臺團隊,建設公司大數(shù)據(jù)平臺,為EA全球工作室提供數(shù)據(jù)能力支持。
2016年回國聯(lián)合創(chuàng)立智領云科技有限公司,組建智領云技術團隊,開發(fā)了BDOS大數(shù)據(jù)平臺操作系統(tǒng)。
孫浩峰
智領云科技市場總監(jiān)
前CSDN內容運營副總編,負責網(wǎng)站內容和商務合作、新媒體方面事宜,關注云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等技術領域,對云計算、網(wǎng)絡技術、網(wǎng)絡存儲有深刻認識。擁有豐富的媒體從業(yè)經(jīng)驗和專業(yè)的網(wǎng)絡安全技術功底,具有超過15年的企業(yè)級IT市場傳播、推廣、宣傳和寫作經(jīng)驗,撰寫過多篇在業(yè)界具有一定影響力的文章。
前言
部分 數(shù)據(jù)中臺與硅谷大數(shù)據(jù)平臺
第1章 全面了解數(shù)據(jù)中臺
1.1 數(shù)據(jù)中臺概念的起源 3
1.1.1 藝電的數(shù)據(jù)中臺改造 4
1.1.2 Twitter的數(shù)據(jù)驅動 6
1.2 什么是數(shù)據(jù)中臺 8
1.2.1 數(shù)據(jù)中臺建設的目標 8
1.2.2 如何實現(xiàn)數(shù)據(jù)中臺建設的目標 11
1.2.3 數(shù)據(jù)中臺的定義和4個特點 13
1.3 大數(shù)據(jù)平臺與數(shù)據(jù)中臺 16
1.3.1 為什么要建設數(shù)據(jù)中臺 16
1.3.2 數(shù)據(jù)中臺與傳統(tǒng)大數(shù)據(jù)平臺的區(qū)別 20
1.3.3 數(shù)據(jù)中臺的評判標準 24
1.4 數(shù)據(jù)中臺建設方法論總綱 24
1.5 本章小結 27
第2章 數(shù)據(jù)中臺能力和應用場景
2.1 數(shù)據(jù)中臺不是銀彈 28
2.2 數(shù)據(jù)中臺的核心能力 31
2.2.1 全局商業(yè)洞見 31
2.2.2 個性化服務 34
2.2.3 實時數(shù)據(jù)報表 38
2.2.4 共享能力開發(fā)新業(yè)務 39
2.3 數(shù)據(jù)中臺的行業(yè)應用場景 41
2.3.1 互聯(lián)網(wǎng)行業(yè) 41
2.3.2 連鎖零售業(yè) 42
2.3.3 金融業(yè) 43
2.3.4 物聯(lián)網(wǎng) 44
2.4 數(shù)據(jù)中臺如何為企業(yè)賦能 45
2.4.1 組織架構 46
2.4.2 決策部門 48
2.4.3 業(yè)務部門 51
2.4.4 研發(fā)部門 53
2.4.5 大數(shù)據(jù)部門 55
2.5 本章小結 56
第3章 數(shù)據(jù)中臺與數(shù)字化轉型
3.1 數(shù)字化轉型的4個階段 58
3.1.1 信息化 58
3.1.2 數(shù)據(jù)倉庫(數(shù)據(jù)平臺1.0) 59
3.1.3 大數(shù)據(jù)平臺(數(shù)據(jù)平臺2.0) 61
3.1.4 數(shù)據(jù)中臺(數(shù)據(jù)平臺3.0) 63
3.2 數(shù)據(jù)驅動 64
3.2.1 面向用戶的數(shù)據(jù)驅動產品及服務 66
3.2.2 面向內部業(yè)務部門的數(shù)據(jù)驅動服務 68
3.2.3 數(shù)據(jù)驅動的系統(tǒng)管理 71
3.3 數(shù)據(jù)中臺如何支持數(shù)字化轉型 72
3.3.1 從技術層面支持數(shù)字化轉型 73
3.3.2 從組織架構層面支持數(shù)字化轉型 74
3.4 本章小結 75
第4章 從大數(shù)據(jù)平臺到數(shù)據(jù)中臺
4.1 大數(shù)據(jù)平臺建設階段 76
4.1.1 大數(shù)據(jù)平臺起步 77
4.1.2 系統(tǒng)自動化 77
4.1.3 大數(shù)據(jù)平臺的生產化 78
4.2 數(shù)據(jù)管理及應用階段 80
4.2.1 數(shù)據(jù)湖/數(shù)據(jù)倉庫建設 80
4.2.2 數(shù)據(jù)管理 81
4.2.3 數(shù)據(jù)安全 82
4.3 數(shù)據(jù)能力中臺化階段 84
4.3.1 全局的數(shù)據(jù)治理 85
4.3.2 數(shù)據(jù)能力的復用和共享 85
4.3.3 云原生架構的支撐 85
4.4 DataOps 87
4.4.1 什么是DataOps 87
4.4.2 DataOps解決的問題 88
4.4.3 DataOps的目標功能 90
4.4.4 DataOps的主要技術 91
4.4.5 DataOps與數(shù)據(jù)中臺 92
4.5 本章小結 93
第二部分 數(shù)據(jù)中臺架構與方法論
第5章 數(shù)據(jù)中臺建設須知
5.1 數(shù)據(jù)中臺建設需要一套方法論 96
5.2 從失敗的大數(shù)據(jù)項目中吸取教訓 98
5.3 數(shù)據(jù)中臺建設中的常見問題 99
5.4 評判數(shù)據(jù)中臺建設效果 101
5.5 數(shù)據(jù)中臺建設的人員規(guī)劃 103
5.6 數(shù)據(jù)中臺的技術選型要求 106
5.7 本章小結 107
第6章 數(shù)據(jù)中臺建設方法論
6.1 基礎架構 109
6.2 數(shù)據(jù)工具 114
6.3 頂層架構設計 115
6.4 數(shù)據(jù)規(guī)范 116
6.5 業(yè)務驅動 118
6.6 關鍵指標 120
6.7 明確責權利 125
6.8 管理迭代 127
6.9 數(shù)據(jù)中臺建設流程 128
6.10 本章小結 130
第7章 數(shù)據(jù)中臺的架構
7.1 數(shù)據(jù)中臺的功能定位 132
7.2 數(shù)據(jù)中臺架構設計的9大原則 135
7.3 典型的硅谷大數(shù)據(jù)平臺架構 137
7.3.1 Twitter的大數(shù)據(jù)平臺架構 137
7.3.2 Airbnb的大數(shù)據(jù)平臺架構 140
7.3.3 Uber的大數(shù)據(jù)平臺架構 141
7.3.4 云平臺作為大數(shù)據(jù)平臺的通用底座 143
7.3.5 硅谷大數(shù)據(jù)平臺架構的共性和建設思路 145
7.4 數(shù)據(jù)中臺架構 147
7.5 數(shù)據(jù)中臺子系統(tǒng) 150
7.5.1 應用基礎能力平臺 151
7.5.2 數(shù)據(jù)基礎能力平臺 152
7.5.3 數(shù)據(jù)集成開發(fā)平臺 154
7.5.4 數(shù)據(jù)資產運營平臺 156
7.5.5 數(shù)據(jù)業(yè)務能力層 158
7.5.6 數(shù)據(jù)中臺重點建設內容 159
7.6 本章小結 160
第8章 數(shù)據(jù)中臺與云原生架構
8.1 云原生架構及云平臺 161
8.2 PaaS平臺的主要功能 165
8.2.1 資源管理 167
8.2.2 應用全生命周期管理 169
8.2.3 高可用和容錯 170
8.2.4 運維平臺 172
8.3 傳統(tǒng)方式下搭建數(shù)據(jù)中臺的難點 173
8.4 云原生架構對于數(shù)據(jù)中臺建設的5大意義 175
8.5 數(shù)據(jù)中臺的IaaS層選擇 178
8.6 本章小結 180
第三部分 數(shù)據(jù)中臺技術選型與核心內容
第9章 數(shù)據(jù)中臺建設與開源軟件
9.1 開源軟件的起源和建設過程 185
9.2 開源軟件的合理使用 189
9.3 集成開源軟件的5個注意事項 192
9.4 應用基礎能力平臺的開源選擇 193
9.5 數(shù)據(jù)基礎能力平臺的開源選擇 196
9.6 數(shù)據(jù)集成開發(fā)平臺的開源選擇 203
9.7 本章小結 205
第10章 數(shù)據(jù)湖與數(shù)據(jù)倉庫
10.1 數(shù)據(jù)湖 207
10.1.1 數(shù)據(jù)湖的起源與作用 208
10.1.2 數(shù)據(jù)湖建設的4個目標 211
10.1.3 數(shù)據(jù)湖數(shù)據(jù)的采集和存儲 212
10.1.4 數(shù)據(jù)湖中的數(shù)據(jù)治理 216
10.2 數(shù)據(jù)倉庫 218
10.2.1 數(shù)據(jù)建模方式 219
10.2.2 數(shù)據(jù)倉庫建設的層次 221
10.2.3 數(shù)據(jù)倉庫中的數(shù)據(jù)治理 225
10.2.4 數(shù)據(jù)清洗 229
10.3 數(shù)據(jù)中臺中的數(shù)據(jù)倉庫和數(shù)據(jù)湖建設 231
10.4 本章小結 233
第11章 數(shù)據(jù)資產管理
11.1 數(shù)據(jù)資產管理的難題 235
11.2 數(shù)據(jù)資產管理定義 238
11.3 主數(shù)據(jù)管理 239
11.4 元數(shù)據(jù)管理 242
11.4.1 元數(shù)據(jù)的分類 243
11.4.2 元數(shù)據(jù)管理系統(tǒng)的功能 245
11.5 開源的元數(shù)據(jù)管理系統(tǒng) 247
11.6 數(shù)據(jù)資產的ROI 249
11.7 本章小結 250
第12章 數(shù)據(jù)流水線管理
12.1 數(shù)據(jù)流水線的定義與模型 251
12.2 數(shù)據(jù)流水線中的應用類別 254
12.3 數(shù)據(jù)流水線的運行方式 256
12.4 數(shù)據(jù)流水線示例 257
12.5 數(shù)據(jù)流水線管理系統(tǒng)面臨的挑戰(zhàn) 259
12.6 數(shù)據(jù)流水線管理系統(tǒng)的功能需求 262
12.6.1 自動化流水線 262
12.6.2 數(shù)據(jù)管理 263
12.6.3 性能要求 264
12.7 數(shù)據(jù)流水線管理系統(tǒng)的組件 265
12.8 批流合一的數(shù)據(jù)流水線 266
12.9 本章小結 269
第13章 數(shù)據(jù)中臺應用開發(fā)
13.1 數(shù)據(jù)應用的形態(tài) 270
13.2 應用開發(fā)工具 277
13.3 3種典型的數(shù)據(jù)中臺應用 279
13.3.1 數(shù)據(jù)即服務 279
13.3.2 模型即服務 281
13.3.3 用戶標簽系統(tǒng) 282
13.4 數(shù)據(jù)中臺應用的開發(fā)和管理 283
13.4.1 應用調度系統(tǒng) 284
13.4.2 多租戶管理 285
13.4.3 持續(xù)集成和發(fā)布 286
13.5 本章小結 287
第14章 數(shù)據(jù)門戶
14.1 數(shù)據(jù)門戶出現(xiàn)的背景 288
14.2 硅谷的數(shù)據(jù)門戶建設 289
14.2.1 Twitter的DAL和EagleEye 290
14.2.2 LinkedIn的Data Hub 292
14.2.3 Airbnb的Data Portal 293
14.2.4 Lyft的Amundsen 294
14.2.5 Netflix的Metacat 296
14.2.6 Intuit的SuperGlue 297
14.2.7 硅谷數(shù)據(jù)門戶總結 298
14.3 數(shù)據(jù)門戶的定位及功能 299
14.4 數(shù)據(jù)門戶的實現(xiàn)原理 301
14.5 數(shù)據(jù)門戶的社交屬性 303
14.6 數(shù)據(jù)應用的自助及協(xié)同工作 304
14.7 數(shù)據(jù)智能運維 306
14.8 本章小結 308
第15章 管理數(shù)據(jù)中臺的演進
15.1 不斷演進的數(shù)據(jù)中臺 310
15.2 人員變動下的數(shù)據(jù)管理 310
15.2.1 數(shù)據(jù)安全 311
15.2.2 數(shù)據(jù)能力的傳遞 312
15.3 數(shù)據(jù)和應用的演進 314
15.4 資源的演進 316
15.5 演進中的關鍵指標 318
15.6 本章小結 321
第四部分 數(shù)據(jù)中臺案例分析
第16章 EA數(shù)據(jù)中臺實踐
16.1 建設背景 324
16.2 組織架構調整 327
16.3 建設過程 328
16.4 體系架構 333
16.5 數(shù)據(jù)治理 336
16.5.1 數(shù)據(jù)標準和規(guī)范 336
16.5.2 元數(shù)據(jù)管理 338
16.5.3 數(shù)據(jù)質量管理 339
16.6 數(shù)據(jù)應用產品 340
16.6.1 推薦系統(tǒng) 340
16.6.2 打造動態(tài)游戲體驗 341
16.6.3 標簽系統(tǒng)及游戲運營 343
16.7 EA數(shù)據(jù)中臺功能總結 344
16.8 本章小結 345
第17章 零售行業(yè)的數(shù)據(jù)中臺
17.1 零售行業(yè)的數(shù)字化轉型 346
17.2 零售行業(yè)數(shù)據(jù)中臺解決方案 347
17.3 零售行業(yè)數(shù)據(jù)中臺的建設 349
17.3.1 數(shù)據(jù)匯聚 350
17.3.2 業(yè)務調研 352
17.3.3 數(shù)據(jù)倉庫建設及數(shù)據(jù)分析 354
17.3.4 業(yè)務系統(tǒng)的能力反饋 356
17.4 零售行業(yè)數(shù)據(jù)中臺的應用場景 357
17.4.1 用戶標簽體系 357
17.4.2 精準市場營銷 359
17.5 本章小結 361
第18章 物聯(lián)網(wǎng)領域數(shù)據(jù)中臺建設
18.1 現(xiàn)代物聯(lián)網(wǎng)的產業(yè)鏈 362
18.2 物聯(lián)網(wǎng)與ABC 365
18.3 物聯(lián)網(wǎng)數(shù)據(jù)中臺架構 366
18.4 智慧建筑物聯(lián)網(wǎng)數(shù)據(jù)中臺應用 371
18.5 本章小結 374