企業(yè)級(jí)數(shù)據(jù)架構(gòu):核心要素、架構(gòu)模型、數(shù)據(jù)管理與平臺(tái)搭建 李楊
定 價(jià):99 元
- 作者:李楊
- 出版時(shí)間:2024/3/1
- ISBN:9787111746829
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類(lèi):TP274
- 頁(yè)碼:
- 紙張:膠版紙
- 版次:
- 開(kāi)本:16開(kāi)
這是一部從企業(yè)架構(gòu)視角系統(tǒng)講解企業(yè)級(jí)數(shù)據(jù)架構(gòu)的著作,包含數(shù)據(jù)架構(gòu)的原理、方法和實(shí)踐。本書(shū)擬分為四個(gè)部分共17個(gè)章節(jié)來(lái)系統(tǒng)性的闡述數(shù)據(jù)架構(gòu)相關(guān)內(nèi)容;第1部分 架構(gòu)基礎(chǔ)主要包含1個(gè)章節(jié)1.數(shù)據(jù)架構(gòu)與企業(yè)架構(gòu) 其主要從宏觀的角度闡述企業(yè)架構(gòu)與數(shù)據(jù)架構(gòu)的關(guān)系以及重要性使讀者明白數(shù)據(jù)架構(gòu)并不是孤立存在的且與企業(yè)架構(gòu)息息相關(guān)第2部分 數(shù)據(jù)架構(gòu)基礎(chǔ)主要包含5個(gè)章節(jié)從理論以及工具層面闡述數(shù)據(jù)架構(gòu)的構(gòu)成2.數(shù)據(jù)架構(gòu)構(gòu)成 介紹數(shù)據(jù)架構(gòu)的主要組成以及框架3.數(shù)據(jù)存儲(chǔ) 數(shù)據(jù)架構(gòu)落地中常見(jiàn)的存儲(chǔ)選型以及實(shí)用場(chǎng)景4.數(shù)據(jù)調(diào)度與消息傳輸 數(shù)據(jù)架構(gòu)中調(diào)度服務(wù)以及消息傳輸?shù)耐ㄓ眉夹g(shù)選型以及可能出現(xiàn)的關(guān)鍵問(wèn)題以及優(yōu)化手段5.Lambda架構(gòu)與Kappa架構(gòu) 系統(tǒng)性的闡述主流的兩種數(shù)據(jù)架構(gòu)以及使用場(chǎng)景6.輔助類(lèi)組件 數(shù)據(jù)架構(gòu)中幫助測(cè)試以及運(yùn)維人員精準(zhǔn)的定位問(wèn)題的相關(guān)輔助組件,例如日志收集、系統(tǒng)監(jiān)控以及APM等第3部分 數(shù)據(jù)架構(gòu)實(shí)踐 基于大量的業(yè)務(wù)實(shí)踐,總結(jié)數(shù)據(jù)架構(gòu)實(shí)踐中核心組組成以及關(guān)鍵方法進(jìn)行拆解7.企業(yè)數(shù)據(jù)區(qū)域以及流向 以不同的維度去拆解企業(yè)的數(shù)據(jù),幫助讀者構(gòu)建數(shù)據(jù)架構(gòu)的落地層面的意識(shí),知道為什么拆以及如何去拆 8.模型架構(gòu)詳解 以主流的兩種建模方法論為切入點(diǎn),討論并對(duì)比優(yōu)劣并讓讀者拓展模型設(shè)計(jì)中的工具箱。9.模型設(shè)計(jì) 以維度建模為例,詳細(xì)的介紹不同數(shù)據(jù)層級(jí)、不同類(lèi)型數(shù)據(jù)的建模方法,具體案例來(lái)源于大量的模型實(shí)踐10.元數(shù)據(jù) 了解什么是元數(shù)據(jù)及其重要性以及如何管理數(shù)據(jù)11.數(shù)據(jù)質(zhì)量 基于數(shù)據(jù)質(zhì)量去設(shè)計(jì)數(shù)據(jù)質(zhì)量監(jiān)控體系,做好事前防范、事后治理12.數(shù)據(jù)標(biāo)準(zhǔn) 構(gòu)建數(shù)據(jù)標(biāo)準(zhǔn)框架以及流程,挖掘具體數(shù)據(jù)標(biāo)準(zhǔn)落地在企業(yè)中的難度。第4部分 數(shù)據(jù)資產(chǎn)管理13.企業(yè)數(shù)據(jù)資產(chǎn) 企業(yè)數(shù)據(jù)資產(chǎn)的構(gòu)成以及搭建路徑以及工具等14.數(shù)據(jù)治理 結(jié)合元數(shù)據(jù)、數(shù)據(jù)質(zhì)量以及數(shù)據(jù)標(biāo)準(zhǔn)等,系統(tǒng)的闡述數(shù)據(jù)治理類(lèi)型項(xiàng)目的落地15.大數(shù)據(jù)平臺(tái)實(shí)踐 如何一步一步搭建基于Hadoop大數(shù)據(jù)平臺(tái)16.實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)搭建 如何構(gòu)建企業(yè)級(jí)別的實(shí)施數(shù)據(jù)倉(cāng)庫(kù)17.本書(shū)總結(jié) 總結(jié)寫(xiě)書(shū)的感悟以及后續(xù)的一些想法等
(1)作者經(jīng)驗(yàn)豐富:頭部保險(xiǎn)資管公司深數(shù)據(jù)架構(gòu)師,從事數(shù)據(jù)相關(guān)工作10余年,在數(shù)據(jù)架構(gòu)、數(shù)據(jù)治理、數(shù)據(jù)資產(chǎn)管理等領(lǐng)域積累了豐富的經(jīng)驗(yàn)。(2)理論系統(tǒng)全面:系統(tǒng)梳理和闡述了企業(yè)架構(gòu)的基礎(chǔ)知識(shí),以及數(shù)據(jù)架構(gòu)的組成要素、架構(gòu)模型、數(shù)據(jù)治理和數(shù)據(jù)資產(chǎn)管理的理論知識(shí)。(3)實(shí)戰(zhàn)案例豐富:用大量案例輔助理論講解,同時(shí)用離線計(jì)算和實(shí)時(shí)計(jì)算兩大場(chǎng)景的綜合案例進(jìn)行了詳細(xì)展示。(4)資深專(zhuān)家推薦:平安集團(tuán)首席架構(gòu)師與平安資管總經(jīng)理等多位專(zhuān)家聯(lián)袂推薦。
為何寫(xiě)作本書(shū)
2017年英國(guó)《經(jīng)濟(jì)學(xué)人》雜志提出一個(gè)觀點(diǎn):世界上最具價(jià)值的資源不再是石油,而是數(shù)據(jù)。有關(guān)數(shù)據(jù)的各種概念,如數(shù)據(jù)要素、數(shù)字經(jīng)濟(jì)、數(shù)字化轉(zhuǎn)型以及數(shù)據(jù)資產(chǎn)定價(jià)等不斷提出,對(duì)數(shù)據(jù)理論層面的探索從未停止過(guò)。各行各業(yè)乃至整個(gè)社會(huì)都對(duì)數(shù)據(jù)愈發(fā)重視,政府也提出建設(shè)“數(shù)字中國(guó)”的概念。上述種種無(wú)疑對(duì)數(shù)據(jù)從業(yè)者提出了更高的要求。
筆者工作這十幾年來(lái)始終在一線從事開(kāi)發(fā)工作,接觸過(guò)很多企業(yè)內(nèi)部的需求。筆者清楚地感受到,企業(yè)在不同時(shí)期,對(duì)于數(shù)據(jù)平臺(tái)的定位或者期待發(fā)生了很大的變化,同時(shí)企業(yè)高層對(duì)于數(shù)據(jù)的重視程度也在持續(xù)提高。同時(shí),企業(yè)內(nèi)部關(guān)于數(shù)據(jù)平臺(tái)建設(shè)的思路或者對(duì)于從業(yè)者技能的要求也發(fā)生了巨大的變化。
筆者花了很長(zhǎng)時(shí)間去思考一些問(wèn)題,例如:數(shù)據(jù)平臺(tái)在這些年的發(fā)展過(guò)程中,有哪些內(nèi)容是始終不變的,哪些內(nèi)容變得更加重要;從業(yè)者需要掌握哪些技能才能更好地適應(yīng)新時(shí)代的發(fā)展。基于這些思考,筆者寫(xiě)了這本書(shū),從數(shù)據(jù)架構(gòu)的角度闡述不同時(shí)期企業(yè)數(shù)據(jù)平臺(tái)的建設(shè),期望給從業(yè)者提供一些參考。
本書(shū)主要特點(diǎn)
這是一本偏落地實(shí)踐的書(shū)。筆者會(huì)基于自己在一線工作的經(jīng)驗(yàn),在書(shū)中詳細(xì)介紹數(shù)據(jù)架構(gòu)涉及的技術(shù)棧、技術(shù)組件以及數(shù)據(jù)架構(gòu)落地中可能遇到的問(wèn)題,并提供對(duì)應(yīng)的解決方案。
這也是一本包含必要理論的書(shū)。數(shù)據(jù)架構(gòu)涉及大量的概念,不同的概念在不同的階段可能會(huì)有不同的內(nèi)涵。所以本書(shū)會(huì)針對(duì)這些概念以及不同概念之間的因果關(guān)系、邏輯關(guān)系等進(jìn)行詳細(xì)的介紹。通過(guò)這些介紹,相信讀者可以更加深入地了解數(shù)據(jù)架構(gòu)。
本書(shū)會(huì)將書(shū)介紹的組件與書(shū)中提到的理論相結(jié)合,并一步步地帶領(lǐng)讀者搭建自己的迷你版數(shù)據(jù)平臺(tái),以加深讀者對(duì)于數(shù)據(jù)架構(gòu)的理解。
本書(shū)讀者對(duì)象
本書(shū)是一本企業(yè)數(shù)據(jù)架構(gòu)相關(guān)的書(shū),比較全面地介紹了企業(yè)數(shù)據(jù)架構(gòu)在企業(yè)架構(gòu)中的位置以及數(shù)據(jù)架構(gòu)的構(gòu)成等。從內(nèi)容來(lái)看,本書(shū)比較適合以下讀者閱讀:
對(duì)數(shù)據(jù)感興趣的相關(guān)行業(yè)從業(yè)者。
想了解企業(yè)數(shù)字化轉(zhuǎn)型內(nèi)涵的相關(guān)人員。
期望從事數(shù)據(jù)相關(guān)工作的初學(xué)者。
想提升自身能力的數(shù)據(jù)相關(guān)從業(yè)者。
想拓展自己的技術(shù)領(lǐng)域的應(yīng)用開(kāi)發(fā)人員。
正在或者將要進(jìn)行數(shù)據(jù)治理或者數(shù)據(jù)資產(chǎn)建設(shè)的相關(guān)人員。
在建設(shè)企業(yè)數(shù)據(jù)平臺(tái)時(shí)遇到困難的一線人員。
如何閱讀本書(shū)
本書(shū)共17章,分為五部分。
第一部分為架構(gòu)基礎(chǔ)(第1章),將會(huì)總覽性地介紹企業(yè)架構(gòu)及數(shù)據(jù)架構(gòu)的內(nèi)容。
第1章主要介紹企業(yè)架構(gòu)的組成,例如業(yè)務(wù)架構(gòu)、數(shù)據(jù)架構(gòu)及應(yīng)用架構(gòu)等,從不同角度解析兩個(gè)主要企業(yè)架構(gòu)—Zachman框架及TOGAF,并對(duì)比不同組織或者機(jī)構(gòu)對(duì)于數(shù)據(jù)架構(gòu)的理解。
第二部分為數(shù)據(jù)架構(gòu)基礎(chǔ)(第2~6章),從不同方面闡述數(shù)據(jù)架構(gòu)的組成。
第2章主要介紹數(shù)據(jù)架構(gòu)的構(gòu)成,例如數(shù)據(jù)模型、元數(shù)據(jù)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)治理、數(shù)據(jù)資產(chǎn)、數(shù)據(jù)生命周期、數(shù)據(jù)分布、常見(jiàn)數(shù)據(jù)架構(gòu)技術(shù)選型、數(shù)據(jù)調(diào)度等。如果想知道數(shù)據(jù)架構(gòu)的核心組成,建議仔細(xì)閱讀這一章。
第3章主要介紹數(shù)據(jù)架構(gòu)中數(shù)據(jù)存儲(chǔ)的發(fā)展以及不同類(lèi)型數(shù)據(jù)存儲(chǔ)的特點(diǎn),然后分別從集中式數(shù)據(jù)庫(kù)、分布式數(shù)據(jù)庫(kù)、大數(shù)據(jù)存儲(chǔ)、特定領(lǐng)域存儲(chǔ)、實(shí)時(shí)計(jì)算階段等方面進(jìn)行詳細(xì)闡述。如果對(duì)于不同類(lèi)型的數(shù)據(jù)存儲(chǔ)都非常了解的話,這一章可以選擇性閱讀。
第4章主要介紹數(shù)據(jù)存儲(chǔ)中數(shù)據(jù)調(diào)度與消息傳輸?shù)南嚓P(guān)內(nèi)容,對(duì)比了不同類(lèi)型的商業(yè)ETL軟件的區(qū)別,之后分別介紹了開(kāi)源調(diào)度平臺(tái)(Airflow)、ETL工具(DataX)、消息中間件(Kafka)的架構(gòu)及核心概念等。讀者可以根據(jù)自己對(duì)這些內(nèi)容的了解程度有選擇地閱讀這一章。
第5章主要介紹數(shù)據(jù)架構(gòu)的演進(jìn),引出Lambda架構(gòu)和Kappa架構(gòu),并詳細(xì)介紹這兩種架構(gòu)的組成及區(qū)別,最后簡(jiǎn)單介紹流批一體化的優(yōu)劣勢(shì)。
第6章主要介紹數(shù)據(jù)架構(gòu)落地中可能涉及的各種輔助類(lèi)應(yīng)用,例如資源管理、資源及組件監(jiān)控、應(yīng)用監(jiān)控以及日志監(jiān)控等。如果企業(yè)內(nèi)部已經(jīng)有比較成熟的解決方案,這一章可以作為拓展閱讀內(nèi)容。
第三部分為數(shù)據(jù)架構(gòu)模型實(shí)踐(第7~9章),詳細(xì)介紹了數(shù)據(jù)架構(gòu)涉及的數(shù)據(jù)模型的部分。
第7章主要介紹企業(yè)內(nèi)部數(shù)據(jù)區(qū)的劃分以及企業(yè)內(nèi)部數(shù)據(jù)的流向等內(nèi)容,包括大多數(shù)企業(yè)內(nèi)部數(shù)據(jù)區(qū)層級(jí)的劃分以及每一層級(jí)的作用,并介紹互聯(lián)網(wǎng)公司的集成型數(shù)據(jù)區(qū)分層特點(diǎn)等。
第8章主要介紹數(shù)據(jù)模型架構(gòu)的內(nèi)容,包括建模策略、建模步驟、建模方法論以及常見(jiàn)模型概述等。對(duì)于數(shù)據(jù)建模比較感興趣的讀者可以仔細(xì)閱讀這一章內(nèi)容。
第9章主要介紹維度建模的內(nèi)容,包括維度建模概述、維度建?偩結(jié)構(gòu)、維度詳解、緩慢變化維度、事實(shí)表詳解、事務(wù)型事實(shí)表等。對(duì)于維度建模的各種概念不是很理解的讀者可以仔細(xì)閱讀這一章內(nèi)容。
第四部分為數(shù)據(jù)資產(chǎn)管理(第10~14章),第10~12章介紹數(shù)據(jù)架構(gòu)的核心內(nèi)容,第
13章及第14章介紹企業(yè)如何開(kāi)展數(shù)據(jù)治理以及數(shù)據(jù)資產(chǎn)相關(guān)工作。
第10章主要介紹元數(shù)據(jù)管理,包括元數(shù)據(jù)的產(chǎn)生、分類(lèi)及價(jià)值等,同時(shí)介紹元數(shù)據(jù)的應(yīng)用及生命周期等,最后闡述如何構(gòu)建元數(shù)據(jù)管理體系。
第11章主要介紹數(shù)據(jù)質(zhì)量管理,主要內(nèi)容包括數(shù)據(jù)質(zhì)量的管理框架、核心維度及規(guī)則體系等,同時(shí)介紹企業(yè)如何進(jìn)行數(shù)據(jù)質(zhì)量評(píng)估。
第12章主要介紹數(shù)據(jù)標(biāo)準(zhǔn)管理,詳細(xì)闡述了數(shù)據(jù)標(biāo)準(zhǔn)的內(nèi)涵、體系設(shè)計(jì)框架、管理流程以及面臨的挑戰(zhàn),最后系統(tǒng)闡述數(shù)據(jù)標(biāo)準(zhǔn)與數(shù)據(jù)質(zhì)量的關(guān)系。如果想系統(tǒng)了解不同概念之間的關(guān)系,需要花點(diǎn)時(shí)間閱讀這一章內(nèi)容。
第13章主要介紹數(shù)據(jù)治理的相關(guān)內(nèi)容,就數(shù)據(jù)治理的產(chǎn)生原因、內(nèi)涵、核心準(zhǔn)則、通用流程等內(nèi)容進(jìn)行闡述,最后列舉數(shù)據(jù)治理面臨的挑戰(zhàn)以及相應(yīng)的應(yīng)對(duì)方式。推薦將要或者正在進(jìn)行數(shù)據(jù)治理的讀者仔細(xì)閱讀這一章內(nèi)容。
第14章主要介紹數(shù)據(jù)資產(chǎn)管理相關(guān)的內(nèi)容,包括數(shù)據(jù)資產(chǎn)的現(xiàn)狀以及當(dāng)前企業(yè)可以進(jìn)行的數(shù)據(jù)資產(chǎn)管理內(nèi)容,梳理數(shù)據(jù)資產(chǎn)與其他概念之間的關(guān)系,同時(shí)詳細(xì)介紹如何展開(kāi)數(shù)據(jù)資產(chǎn)目錄構(gòu)建工作。
第五部分為數(shù)據(jù)架構(gòu)實(shí)踐(第15~17章),從實(shí)踐的角度對(duì)前面的內(nèi)容進(jìn)行了介紹。
第15章主要介紹離線計(jì)算的相關(guān)實(shí)踐,并以某個(gè)具體的場(chǎng)景為例展開(kāi)介紹,包括架構(gòu)設(shè)計(jì)、軟件部署、模型設(shè)計(jì)、數(shù)據(jù)處理及離線計(jì)算數(shù)據(jù)應(yīng)用等。
第16章主要介紹實(shí)時(shí)計(jì)算的相關(guān)實(shí)踐,同樣以某個(gè)具體的場(chǎng)景為例展開(kāi)深入介紹,包括架構(gòu)設(shè)計(jì)、軟件部署、連通性配置、實(shí)時(shí)計(jì)算層等。
第17章主要結(jié)合筆者自身的理解以及在行業(yè)內(nèi)的多年觀察對(duì)數(shù)字未來(lái)進(jìn)行展望,希望可以給讀者帶來(lái)一些啟發(fā)。
由于水平有限,書(shū)中可能存在一些描述不準(zhǔn)確或者錯(cuò)誤的地方,懇請(qǐng)讀者多多包涵。同時(shí)期待本書(shū)可以對(duì)讀者的工作提供一些幫助。
李楊
資深數(shù)據(jù)架構(gòu)師,在數(shù)據(jù)相關(guān)領(lǐng)域有10年以上工作經(jīng)驗(yàn)。頭部保險(xiǎn)資管公司科技平臺(tái)交易系統(tǒng)團(tuán)隊(duì)開(kāi)發(fā)組負(fù)責(zé)人,負(fù)責(zé)多個(gè)應(yīng)用以及數(shù)據(jù)平臺(tái)的建設(shè)、優(yōu)化以及遷移工作。曾擔(dān)任某數(shù)據(jù)公司技術(shù)合伙人,負(fù)責(zé)多個(gè)金融機(jī)構(gòu)的數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)平臺(tái)相關(guān)的工作。
在數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)治理等領(lǐng)域有著非常深厚的積累,熟悉不同行業(yè)的數(shù)字化轉(zhuǎn)型。此外,他還是一名經(jīng)驗(yàn)豐富的應(yīng)用工程師,對(duì)大數(shù)據(jù)、數(shù)據(jù)庫(kù)以及主流的技術(shù)棧有著非常深入的了解。
2022年被集團(tuán)評(píng)為“優(yōu)秀架構(gòu)師”,積極參與行業(yè)內(nèi)部的相關(guān)課題研究,是《保險(xiǎn)問(wèn)道
之保險(xiǎn)資管數(shù)字化探索》一書(shū)的執(zhí)筆人之一,是中資協(xié)《金融科技賦能保險(xiǎn)資管風(fēng)險(xiǎn)管控的研究》課題核心組成員之一。
序
自序
前言
第一部分 架構(gòu)基礎(chǔ)
第1章 企業(yè)架構(gòu)概述3
1.1 企業(yè)架構(gòu)4
1.2 Zachman框架4
1.2.1 Zachman框架的維度4
1.2.2 Zachman框架的特點(diǎn)5
1.2.3 Zachman框架的使用6
1.3 TOGAF6
1.3.1 TOGAF完善架構(gòu)過(guò)程7
1.3.2 框架核心:ADM8
1.4 業(yè)務(wù)架構(gòu)9
1.4.1 業(yè)務(wù)架構(gòu)的價(jià)值9
1.4.2 業(yè)務(wù)架構(gòu)的關(guān)鍵點(diǎn)10
1.5 數(shù)據(jù)架構(gòu)11
1.5.1 數(shù)據(jù)架構(gòu)設(shè)計(jì)12
1.5.2 數(shù)據(jù)架構(gòu)核心組成12
1.6 總結(jié)13
第二部分 數(shù)據(jù)架構(gòu)基礎(chǔ)
第2章 數(shù)據(jù)架構(gòu)構(gòu)成18
2.1 數(shù)據(jù)模型18
2.2 元數(shù)據(jù)19
2.3 數(shù)據(jù)質(zhì)量20
2.4 數(shù)據(jù)標(biāo)準(zhǔn)21
2.5 數(shù)據(jù)治理21
2.6 數(shù)據(jù)資產(chǎn)22
2.6.1 數(shù)據(jù)管理22
2.6.2 數(shù)據(jù)倉(cāng)庫(kù)22
2.6.3 數(shù)據(jù)湖23
2.6.4 數(shù)據(jù)資產(chǎn)內(nèi)涵23
2.7 數(shù)據(jù)生命周期24
2.7.1 數(shù)據(jù)創(chuàng)建25
2.7.2 數(shù)據(jù)使用25
2.7.3 數(shù)據(jù)歸檔26
2.7.4 數(shù)據(jù)銷(xiāo)毀26
2.8 數(shù)據(jù)分布27
2.8.1 數(shù)據(jù)存儲(chǔ)27
2.8.2 數(shù)據(jù)訪問(wèn)27
2.9 常見(jiàn)數(shù)據(jù)架構(gòu)技術(shù)選型28
2.9.1 Lambda28
2.9.2 Kappa29
2.10 數(shù)據(jù)調(diào)度30
2.11 總結(jié)30
第3章 數(shù)據(jù)存儲(chǔ)31
3.1 數(shù)據(jù)存儲(chǔ)基礎(chǔ)32
3.1.1 計(jì)算機(jī)組成基礎(chǔ)結(jié)構(gòu)32
3.1.2 數(shù)據(jù)存儲(chǔ)核心概念35
3.1.3 OLTP與OLAP場(chǎng)景37
3.2 集中式數(shù)據(jù)庫(kù)38
3.2.1 常見(jiàn)關(guān)系型數(shù)據(jù)庫(kù)38
3.2.2 分庫(kù)分表39
3.3 分布式數(shù)據(jù)庫(kù)40
3.3.1 大規(guī)模并行處理技術(shù)40
3.3.2 分布式事務(wù)41
3.4 大數(shù)據(jù)存儲(chǔ)43
3.4.1 HDFS43
3.4.2 Yarn44
3.4.3 Hive44
3.4.4 HBase45
3.4.5 Spark及Spark Streaming46
3.5 特定領(lǐng)域存儲(chǔ)46
3.5.1 ClickHouse46
3.5.2 Elasticsearch48
3.6 實(shí)時(shí)計(jì)算階段49
3.7 總結(jié)49
第4章 數(shù)據(jù)調(diào)度與消息傳輸50
4.1 通用技術(shù)選型50
4.2 Airflow調(diào)度平臺(tái)52
4.2.1 Airflow基礎(chǔ)概念52
4.2.2 Airflow架構(gòu)54
4.2.3 Airflow與其他調(diào)度平臺(tái)對(duì)比55
4.3 DataX數(shù)據(jù)同步工具56
4.3.1 DataX基礎(chǔ)概念56
4.3.2 DataX數(shù)據(jù)同步57
4.3.3 DataX優(yōu)化59
4.3.4 DataX與其他數(shù)據(jù)同步工具對(duì)比60
4.4 Kafka消息中間件62
4.4.1 Kafka基礎(chǔ)概念62
4.4.2 Kafka架構(gòu)概述63
4.4.3 Kafka高性能原理63
4.4.4 Kafka與其他中間件對(duì)比67
4.5 總結(jié)68
第5章 Lambda架構(gòu)與Kappa架構(gòu)69
5.1 架構(gòu)演進(jìn)69
5.1.1 傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)70
5.1.2 傳統(tǒng)大數(shù)據(jù)架構(gòu)71
5.1.3 流式計(jì)算架構(gòu)72
5.1.4 Lambda架構(gòu)73
5.1.5 Kappa架構(gòu)74
5.2 Lambda架構(gòu)詳解75
5.2.1 架構(gòu)解析76
5.2.2 核心組件78
5.2.3 數(shù)據(jù)流向81
5.3 Kappa架構(gòu)詳解82
5.3.1 架構(gòu)解析82
5.3.2 核心組件85
5.3.3 數(shù)據(jù)流向87
5.4 Lambda與Kappa對(duì)比 87
5.5 流批一體化89
5.6 總結(jié)90
第6章 輔助類(lèi)應(yīng)用體系介紹91
6.1 資源管理91
6.1.1 開(kāi)源堡壘機(jī)JumpServer92
6.1.2 部署與負(fù)載均衡92
6.1.3 核心概念94
6.1.4 最佳實(shí)踐95
6.2 資源及組件監(jiān)控95
6.2.1 開(kāi)源監(jiān)控系統(tǒng)Prometheus 96
6.2.2 可視化系統(tǒng)Grafana98
6.2.3 告警模塊AlertManager100
6.2.4 小結(jié)101
6.3 應(yīng)用監(jiān)控102
6.3.1 應(yīng)用鏈路監(jiān)控Pinpoint102
6.3.2 原理與組件介紹103
6.3.3 最佳實(shí)踐104
6.3.4 小結(jié)106
6.4 日志監(jiān)控107
6.4.1 ELK107
6.4.2 直連式日志收集架構(gòu)107
6.4.3 高并發(fā)日志收集架構(gòu)108
6.5 總結(jié)109
第三部分 數(shù)據(jù)架構(gòu)模型實(shí)踐
第7章 企業(yè)數(shù)據(jù)區(qū)與數(shù)據(jù)流向113
7.1 數(shù)據(jù)區(qū)概述113
7.2 數(shù)據(jù)區(qū)詳解115
7.2.1 操作型數(shù)據(jù)區(qū)115
7.2.2 集成型數(shù)據(jù)區(qū)116
7.2.3 分析型數(shù)據(jù)區(qū)117
7.2.4 歷史數(shù)據(jù)區(qū)118
7.3 企業(yè)數(shù)據(jù)流向119
7.3.1 操作型數(shù)據(jù)區(qū)數(shù)據(jù)流向119
7.3.2 集成型數(shù)據(jù)區(qū)數(shù)據(jù)流向120
7.3.3 分析型數(shù)據(jù)區(qū)數(shù)據(jù)流向121
7.3.4 歷史數(shù)據(jù)區(qū)數(shù)據(jù)流向122
7.4 企業(yè)數(shù)據(jù)分層123
7.5 企業(yè)集成型數(shù)據(jù)區(qū)層級(jí)124
7.5.1 數(shù)據(jù)緩沖層 125
7.5.2 數(shù)據(jù)貼源層126
7.5.3 標(biāo)準(zhǔn)模型層127
7.5.4 整合模型層127
7.5.5 數(shù)據(jù)集市層128
7.6 互聯(lián)網(wǎng)公司的集成型數(shù)據(jù)區(qū)分層特點(diǎn)129
7.7 總結(jié)130
第8章 數(shù)據(jù)模型架構(gòu)詳解131
8.1 為什么要建模132
8.2 建模策略134
8.2.1 數(shù)據(jù)緩沖層建模策略135
8.2.2 數(shù)據(jù)貼源層建模策略135
8.2.3 標(biāo)準(zhǔn)模型層建模策略136