這是一部全面剖析銀行運維架構和運維實戰(zhàn)經驗的著作。
作者團隊有豐富的銀行業(yè)經驗,多年來,不僅在銀行運維中全面推廣和落地大數(shù)據(jù)、云計算、人工智能等新興技術,而且將成功、成熟的方法和經驗標準化、服務化,運用各種技術手段,打造了一個高質量的、自動化的、智能化的運維體系,提升了系統(tǒng)的穩(wěn)定性和運維的效率。
本書是該團隊的經驗總結,他們把一些優(yōu)秀的實踐、流程、方法固化為代碼、工具和平臺,希望對銀行、證券、基金等行業(yè)的科技團隊或金融科技公司有所幫助。
全書共9章:
第1章首先介紹了商業(yè)銀行信息系統(tǒng)建設的背景和IT服務理論的演進路徑,然后講解了IT運維團隊在金融科技時代面臨的挑戰(zhàn)以及如何助力數(shù)字化轉型;
第2~3章詳細講解了銀行IT基礎架構的前世(傳統(tǒng)IT架構)和今生(新興IT架構),不僅可以了解銀行IT基礎架構的演進過程,而且還可以掌握銀行傳統(tǒng)的基礎設施架構、網絡架構、災備架構以及新興的容器化架構、部署架構、云計算架構、網絡安全架構、存儲架構、備份架構等;
第4章總結了銀行運維工程師日常的核心工作,包括運維組織管理、巡檢、系統(tǒng)變更、組件化、事件管理、運維標準化等,幫助讀者在重復、繁瑣的日常工作中尋求破局之道;
第5~7章依次講解了如何構建全鏈路的立體化的監(jiān)控體系、自動化的運維體系,以及智能化運維(AIOps)的方法和經驗;
第8~9章講解了銀行雙活數(shù)據(jù)中心的架構以及下一代的數(shù)據(jù)中心關鍵技術。
傳統(tǒng)銀行業(yè)在IT建設層面推進的原動力是信息化,關鍵字是“信息”,這一細節(jié)在很多方面都有所體現(xiàn)。對于擁有信息科技部門的商業(yè)銀行機構,其IT部門的負責人稱為CIO(Chief Information Officer,首席信息官),而互聯(lián)網公司、科技公司則更看重“科技”,其IT部門的負責人稱為CTO(Chief Technology Officer,首席技術官),從中可見一斑。商業(yè)銀行IT組織架構過去往往是按照“一部兩中心”進行設計。“一部”通常是指“信息科技部”或者“信息技術部”,作為專門的科技部門負責全行信息科技工作的統(tǒng)籌管理。“兩中心”則分別是開發(fā)中心和數(shù)據(jù)中心。開發(fā)中心負責制定全行軟件開發(fā)的標準和流程,組織實施全行各應用系統(tǒng)的需求分析、設計、開發(fā)、測試及技術支持等相關工作;數(shù)據(jù)中心負責全行信息系統(tǒng)生產運營管理和基礎環(huán)境、網絡通信及各系統(tǒng)平臺的維護和技術支持,為全行的業(yè)務發(fā)展提供安全、持續(xù)、高效、優(yōu)質的信息系統(tǒng)服務。.長期以來,很多商業(yè)銀行的信息科技部門被定位為中后臺部門,作為成本部門,每年花了多少錢很清晰,為全行創(chuàng)造了多少價值、贏取了多少次業(yè)務機會卻很難估算,對業(yè)務價值的貢獻只能定性而無法定量,長期被視為輔助角色。與此同時,部分商業(yè)銀行受人員指標限制,許多IT相關的工作,包括設計、編碼、測試、運維等方面大量采用外包服務,甚至升級、擴容、容災都由外包單位實施,行內科技人員更多是擔任與外包商打交道的項目經理角色。隨著互聯(lián)網金融業(yè)務的迅猛發(fā)展,近年來一些高科技公司借助自身的互聯(lián)網優(yōu)勢跨界金融,廣泛運用如人工智能、區(qū)塊鏈、云計算、大數(shù)據(jù)等新興技術,采用敏捷研發(fā)模式,在金融領域重構了客戶關系、業(yè)務模式、運營體系,甚至對金融格局產生了深遠影響。相比之下,傳統(tǒng)銀行的科技水平給人一種落后、落伍的感覺。.不過,不要低估銀行在信息科技方面的實力,銀行業(yè)歷來是先進技術應用的先行者,在經歷了電子化、信息化、移動化階段后,如今已進入數(shù)字化階段。借由共生式發(fā)展關系,現(xiàn)代金融體系也發(fā)生了很大變化。銀行業(yè)始終緊跟科技發(fā)展浪潮,在尋求差異化競爭、推動企業(yè)數(shù)字化轉型的征途中,越來越重視信息科技方面的投入和建設,積極實施金融科技戰(zhàn)略,重構科技創(chuàng)新體制機制,力求以科技激發(fā)傳統(tǒng)金融的供給側輸出能力,進而推動銀行商業(yè)模式乃至發(fā)展方式的變革。在數(shù)字化時代,金融科技已經成為數(shù)字化轉型的重要驅動力,科技引領的金融變革將是時代的主旋律。.2016年年底銀監(jiān)會在《中國銀行業(yè)信息科技“十三五”發(fā)展規(guī)劃監(jiān)管指導意見(征求意見稿)》中明確聲明要讓CIO進入決策層,共同參與制定銀行的未來發(fā)展整體戰(zhàn)略規(guī)劃;2018年Gartner在報告《2018 CIO Agenda》中指出:CIO的職責發(fā)生了巨大轉變,從原來的 “交付型”高管變成了“IT和業(yè)務相結合”的高管——CIO的角色從交付執(zhí)行者轉變?yōu)闃I(yè)務執(zhí)行者;2019年8月,中國人民銀行印發(fā)《金融科技(FinTech) 發(fā)展規(guī)劃(2019—2021年)》,明確指出金融科技是技術驅動的金融創(chuàng)新,要加強金融科技戰(zhàn)略部署,從長遠視角加強頂層設計,把握金融科技發(fā)展態(tài)勢,做好統(tǒng)籌規(guī)劃、體制機制優(yōu)化等工作,全面提升金融科技應用水平,將金融科技打造成金融高質量發(fā)展的“新引擎”,充分發(fā)揮金融科技賦能作用,推動我國金融業(yè)高質量發(fā)展。.名正則言順,在多家商業(yè)銀行最新的組織架構中,信息科技部已然進化成金融科技部,部分實力較強的商業(yè)銀行更是紛紛組建金融科技公司,不僅對內提升科技力量,還要對外做科技能力輸出。.我國商業(yè)銀行類型眾多,數(shù)量巨大,包括政策性銀行、大型國有商業(yè)銀行、全國性股份制商業(yè)銀行,以及多達數(shù)千家的地方性銀行,這些銀行的業(yè)務開展形態(tài)迥異,在信息科技建設投入和模式方面更是差異巨大。過去銀行的信息科技建設整體偏保守,無論是監(jiān)管機構的監(jiān)管條例,還是商業(yè)銀行內部的運行要求,對信息系統(tǒng)的要求都是“數(shù)據(jù)不丟失、業(yè)務不中斷”,即能夠接受系統(tǒng)慢,但絕對不能惹麻煩。.傳統(tǒng)信息系統(tǒng)架構傾向于集中,采用All in One模式,以及昂貴但成熟穩(wěn)定的商業(yè)化解決方案。但是,這種集中式架構的建設和運營成本高昂,且運行風險較大。隨著經營模式的變化和業(yè)務的拓展,在面對基于互聯(lián)網產業(yè)的高并發(fā)、大數(shù)據(jù)量場景時,集中式架構一旦出現(xiàn)處理能力瓶頸則極難擴展,在關鍵節(jié)點負荷高企的情況下,其發(fā)生故障的影響面較廣,運行風險巨大。相對于集中式架構,以x86 和云計算為基礎的分布式架構在運營成本、伸縮性、風險分散控制等方面優(yōu)勢明顯,所以采用分布式架構是商業(yè)銀行應對成本和運營風險的必然選擇。.互聯(lián)網天生就是去中心化的分布式模式,其業(yè)務系統(tǒng)采取服務化和無狀態(tài)的設計理念,易于橫向擴展,且并發(fā)處理能力和伸縮性遠強于集中式架構。不過,采用分布式架構挑戰(zhàn)更大、困難更多。在可用性保障方面,分布式架構下使用的x86服務器的可靠性遠不如小型機,必須在服務器層和應用系統(tǒng)層等均采用負載均衡以及高可用設計,使系統(tǒng)服務的總體可用性能達到更高標準。同時,要重點關注基礎設施層,包括云計算平臺、網絡、存儲以及跨機房同步復制等設施的可靠性。在數(shù)據(jù)一致性方面,根據(jù)CAP理論,一個系統(tǒng)不能同時滿足一致性、可用性和分區(qū)容錯性這三個要求,如何平衡讀寫分離帶來的可用性和一致性矛盾,也是分布式架構設計必須解決的問題。分布式架構下系統(tǒng)數(shù)量和服務器數(shù)量都會迅速增長,應用系統(tǒng)之間的關聯(lián)關系更為復雜,這也給商業(yè)銀行數(shù)據(jù)中心的穩(wěn)定運維、持續(xù)運營提出了更高要求。.本書作者大都就職于新興的民營體制銀行。這家位于我國西南部的民營銀行,麻雀雖小,五臟俱全:既有傳統(tǒng)銀行科技團隊的特點,深度運用成熟穩(wěn)定的商業(yè)化解決方案,又有互聯(lián)網科技公司的特點,從互聯(lián)網的基因出發(fā),大量選擇互聯(lián)網模式下成熟的開源分布式解決方案。在銀行業(yè)“安全可靠和合規(guī)運行”總體要求的基礎上,在當前互聯(lián)網金融需求極度旺盛,人工智能、云計算、大數(shù)據(jù)等新興技術不斷涌現(xiàn)的新形勢下,作者所在團隊積極推動內部IT運維服務和設施標準化、可視化、容器化、資源池化,充分運用分布式、自動化、云計算、智能化等手段,構建DevOps體系,打通從需求分析、編碼、構建、測試到發(fā)布、部署、運營、監(jiān)控的全生命周期敏捷產品研發(fā),快速變更、快速交付,降低故障修復耗時,提高資源利用率,助力金融企業(yè)數(shù)字化轉型。.本書第1章主要介紹銀行信息系統(tǒng)的建設背景、IT服務理論的演進路徑、IT運維支撐團隊面臨的挑戰(zhàn)以及IT運維變革如何助力數(shù)字化轉型;第2章和第3章從主機、存儲、網絡、備份及多機房容災架構等多個方面,講解商業(yè)銀行基礎設施層架構的變遷;第4章主要講解商業(yè)銀行IT運維日常,以及在重復、煩瑣工作中的破局之道;第5章主要講解如何構建一套覆蓋基礎設施、應用系統(tǒng)、日志、流量追蹤等的立體化監(jiān)控體系;第6章主要講解商業(yè)銀行自動化運維體系;第7章主要講解AIOps方面的探索和實踐;第8章主要講解商業(yè)銀行同城雙活容災架構;第9章從軟件定義數(shù)據(jù)中心、下一代云計算技術、混合云、邊緣計算等方面介紹下一代數(shù)據(jù)中心技術。.本書作者是科技自動化的忠實使用者和推廣者,推崇通過科技手段讓一切都能夠“自己動起來”。對于研發(fā),團隊通過企業(yè)級開發(fā)框架、腳手架和代碼生成工具、統(tǒng)一封裝的各類組件庫來統(tǒng)一開發(fā)標準,提升開發(fā)效率;對于測試,團隊通過提供統(tǒng)一的自動化測試框架,提高代碼單元測試覆蓋率,提高自動化測試用例占比,提升質量團隊的執(zhí)行效率和質量保障水平;對于運維,團隊通過構建自動化裝機、自動化發(fā)布、自動化巡檢、全鏈路監(jiān)控、CMDB等系統(tǒng)建設DevOps體系,提升運行保障的效率和水平。.這些讓一切“自己動起來”的手段并不是要取締流程、擺脫人員,而是要轉變視角,充分運用科技,將流程隱匿在科技(系統(tǒng))的背后,選擇適合企業(yè)現(xiàn)狀的數(shù)字化手段,以科技管科技,讓工作自動流轉,讓消息自動通知,讓信息自動同步,讓狀態(tài)自動變更,讓數(shù)據(jù)自動更新,讓數(shù)字自己跳動。.我們不希望重復勞動,而是希望把一些最佳實踐、流程、方法固化成代碼、工具、平臺,用這種方式來應對數(shù)字化時代金融業(yè)務的規(guī)模擴張,平衡IT系統(tǒng)復雜度提升帶來的影響。我們將自己在信息科技領域實踐過程中的思考和探索展現(xiàn)出來,希望能供商業(yè)銀行、證券、基金等行業(yè)的信息科技團隊或互聯(lián)網企業(yè)及科技公司的朋友參考。在《充滿生機的技術》一書中有這樣一段話深得我心:我們還期待著這本書能超越科技書的范圍,獲得更多的讀者,讓普通大眾知道,在與滿足于有形無實的制度、對名利無休無止的追逐完全背道而馳的地方,有很多人每天都在群策群力,對技術進行著反復的思考和實踐。..李丙洋
李丙洋(網名:君三思)
資深運維專家和數(shù)據(jù)庫專家,擁有10余年IT從業(yè)經驗,現(xiàn)就職于某民營銀行,任金融科技部總經理助理。多項技術專利發(fā)明人,著有《涂抹Oracle》《涂抹MySQL》等著作。
劉正配
高級運維工程師,VMware VCP、網絡及通信認證工程師,長期從事主機、存儲、備份等基礎設施運維,在銀行IT基礎架構、中間件及容器等方面有豐富經驗。
羅丹
重慶大學軟件工程碩士,從事互聯(lián)網運維工作10余年,現(xiàn)就職于某民營銀行,任運維經理,擅長互聯(lián)網平臺運維架構、信息系統(tǒng)災備建設、運維標準化建設及信息安全相關工作。
鄒天涌
架構師,長期主持IT系統(tǒng)架構與開發(fā),在微服務、中間件、基礎設施及能力建設等方面有豐富的經驗;钴S的開源社區(qū)貢獻者,主導ZolltyMVC、Kafka-xclient等框架。熱愛分享技術經驗,CSDN博客專家,發(fā)布原創(chuàng)文章300多篇。
袁瀟
架構師,曾就職于某知名消金公司,及某民營商業(yè)銀行,負責運維自動化平臺開發(fā),在自動化運維體系構建方面有豐富實踐經驗。
秦雨民
高級運維工程師,長期從事系統(tǒng)運維工作,致力于容器云技術、網絡虛擬化、Linux系統(tǒng)內核研究,擅長處理系統(tǒng)、網絡相關疑難問題。