銀行企業(yè)為什么要建設(shè)CMDB項目?推行的難點主要在哪方面?與其他系統(tǒng)關(guān)系是什么?項目上線后如何對運維工作進(jìn)行管理安排?在產(chǎn)品選型過程中需要注意的要點?本文來自金融行業(yè)的社區(qū)會員分享。 ■ 銀行為什么要建設(shè)CMDB項目? @周航 某銀行 軟件架構(gòu)設(shè)計師: 此問題可以從三個角度出發(fā):建設(shè)背景、建設(shè)痛點、建設(shè)價值,下面我為大家一一闡述: 銀行業(yè)CMDB的建設(shè)背景: 銀行業(yè)的CMDB建設(shè)基本上可以定義為三個階段,第一階段主要是臺賬式配置管理,其數(shù)據(jù)主要是通過手工維護(hù)的,基礎(chǔ)需求是為了滿足基礎(chǔ)的硬件資源管理及監(jiān)管要求。第二個階段是面向IT基礎(chǔ)資源的配置管理,其主要關(guān)注各類軟、硬件資源的全生命周期的管理。第三個階段是面向應(yīng)用的全生命周期管理,其重點關(guān)注從應(yīng)用的創(chuàng)建、研發(fā)測試、上線、變更、遷移、下線回收整個過程,同時重點關(guān)注應(yīng)用之間、應(yīng)用內(nèi)各組件以及組件的關(guān)系信息。目前大部分銀行企業(yè)的CMDB建設(shè)處于第一、二階段。 隨著云計算、大數(shù)據(jù)、微服務(wù)的不斷發(fā)展,傳統(tǒng)的CMDB逐漸已無法滿足各類消費需求,具體主要體現(xiàn)在: 1、以IAAS、PAAS為基礎(chǔ)的云環(huán)境與傳統(tǒng)的運維環(huán)境共存,雙態(tài)模式使得數(shù)據(jù)中心的基礎(chǔ)架構(gòu)更加復(fù)雜,也使得CMDB的模型和關(guān)系建設(shè)更加困難。 2、微服務(wù)的發(fā)展使得應(yīng)用內(nèi)的拓?fù)潢P(guān)系、應(yīng)用間的調(diào)用關(guān)系信息更加復(fù)雜,故障定位與變更影響分析等場景愈加困難,進(jìn)而對CMDB的消費依賴以及模型粒度,也從傳統(tǒng)的應(yīng)用級逐步向應(yīng)用模塊、應(yīng)用服務(wù)級轉(zhuǎn)變。 3、隨著ITOA(大數(shù)據(jù)運維)、AIOPS(智能運維)等理念工具引入運維領(lǐng)域,對配置數(shù)據(jù)的消費需求越來越旺盛,對CMDB的準(zhǔn)確性、全面性、及時性也越來越高。 CMDB系統(tǒng)的建設(shè)痛點: 1、數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一 各專業(yè)運維工具各自維護(hù)一套配置數(shù)據(jù),數(shù)據(jù)之間有交叉有重復(fù),缺少統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)和唯一的數(shù)據(jù)源。 2、數(shù)據(jù)準(zhǔn)確性差 (1)大量技術(shù)屬性仍通過手工維護(hù),配置自發(fā)現(xiàn)能力不足。 (2)大量管理類屬性數(shù)據(jù)以臺賬方式手工維護(hù),沒有現(xiàn)有的管理流程和工具深度集成,數(shù)據(jù)準(zhǔn)確性和及時性差。 3、消費場景難以挖掘: CMDB消費場景往往跨條線、跨領(lǐng)域,需要CMDB的產(chǎn)品經(jīng)理具備跨專業(yè)的技術(shù)知識儲備,同時要與各專業(yè)工具進(jìn)行及時有效的溝通交流。 CMDB系統(tǒng)的建設(shè)價值: 1、避免配置數(shù)據(jù)被重復(fù)維護(hù),降低數(shù)據(jù)管理的總成本; 2、整體運維共享同一套配置數(shù)據(jù),使各運維專業(yè)對IT資產(chǎn)的基本配置情況達(dá)成共識,并驅(qū)動各流程的自動化協(xié)同;以CI為核心,拉通各個運維工具中孤立的數(shù)據(jù),并通過面向管理場景的數(shù)據(jù)分析和可視化,使IT管理者能更加全面的掌握CI的運行狀態(tài)和管理現(xiàn)狀,提升管理的透明度。 3、促進(jìn)如下四類消費場景的實施和落地,提升運維實施工作的處理效率以及運維管理工作的精細(xì)化。 監(jiān)控與故障分析場景:CMDB的應(yīng)用、主機(jī)、數(shù)據(jù)庫、中間件等基礎(chǔ)配置信息可促進(jìn)監(jiān)控覆蓋率的提升,同時CMDB的組件間關(guān)系、應(yīng)用關(guān)系數(shù)據(jù)為告警壓制與故障定位提供數(shù)據(jù)基礎(chǔ)。 變更操作實施場景:CMDB為應(yīng)急啟停、災(zāi)備切換、應(yīng)用發(fā)布與部署等自動化操作提供基礎(chǔ)環(huán)境數(shù)據(jù),為變更影響范圍分析提供關(guān)系數(shù)據(jù)。 管理協(xié)同場景:CMDB的主機(jī)、應(yīng)用、組織等信息,為監(jiān)控處理權(quán)限、通知范圍、自動化操作權(quán)限、堡壘機(jī)訪問權(quán)限提供數(shù)據(jù)基礎(chǔ)。 安全管理場景:CMDB的主機(jī)、應(yīng)用、中間件、數(shù)據(jù)庫等信息,為漏洞掃描、入侵檢測等安全管理工作提供數(shù)據(jù)基礎(chǔ)。 綜合上述三點,我們就可以理解銀行為何要上CMDB系統(tǒng)。 @he7yong 研發(fā)工程師: 不僅僅是銀行企業(yè),幾乎所有中大型的企業(yè)都會建設(shè)CMDB CMDB的建設(shè)核心是為了支持ITSM工具和監(jiān)控、自動化等這種運維工具的,從而提升企業(yè)IT運維的質(zhì)量,效率。 @atpeace331 某 銀行 數(shù)據(jù)庫管理員: 看上圖, ITIL 運維管理流程的實施,都離不開 CMDB,無論是 事件管理、還是問題管理,或是變更管理,都需要 CMDB中的基礎(chǔ)設(shè)施信息和軟件信息的查詢,ITIL的5 大運維流程還會經(jīng)常更新 CMDB中的配置信息。 ■ 推行的難點主要在哪方面? @zhh321 某人壽數(shù)據(jù)中心 系統(tǒng)架構(gòu)師: CMDB的核心收益是主數(shù)據(jù)庫帶來的較低的綜合成本。只不過結(jié)合不同場景,其價值又體現(xiàn)在安全內(nèi)控管理(賬號、堡壘機(jī)、防火墻、漏洞補丁、合規(guī)檢查、IP端口)、監(jiān)控告警、自動化運維、資產(chǎn)管理、資源交付、發(fā)布管理、應(yīng)急管理、ITIL流程管理、容量管理等具體領(lǐng)域。沒有主數(shù)據(jù)庫,上面這些工作都要自建配置庫,大型數(shù)據(jù)中心情況下整體成本會很高。 但主數(shù)據(jù)庫這種架構(gòu)天然導(dǎo)致了推廣的悖論,因為人們總是對全局和個體、長期和短期之間糾結(jié)平衡,且整體上會朝著熵增的趨勢發(fā)展。CMDB建設(shè)者從長期、全局的視角來做配置管理工作,但造成各(ge)個(huai)部(gui)門(tai)短期成本提升,這對領(lǐng)導(dǎo)都是一件有難度的事,何況幾乎沒有什么權(quán)利的CMDB團(tuán)隊?換句話說,CMDB本身是一件短期成本高,但從全局和長期才能體現(xiàn)收益的事情,想想人們買保險的心情! 解決辦法抽象的說就是: 1.要獲得高層支持 2.通過具體場景來落實收益 3.設(shè)法轉(zhuǎn)嫁和降低管理成本(蹭熱度,抱大腿;和其他系統(tǒng)、流程形成利益綁定;把要求納入現(xiàn)有獎懲考核) 4.提升用戶犯錯成本(以產(chǎn)品為單位明確責(zé)任人;流程自審計;公開審計結(jié)果) ■ CMDB的定位是什么?與其他系統(tǒng)關(guān)系是什么?哪些數(shù)據(jù)需要歸入到CMDB管理中? @he7yong 研發(fā)工程師: CMDB的業(yè)務(wù)定位是IT戰(zhàn)略相關(guān)項目;技術(shù)定位是IT運維管理的主數(shù)據(jù)。這個地方非常多的人有誤解,很多人認(rèn)為CMDB是為配置管理服務(wù)的,CMDB是為整個IT管理提供主數(shù)據(jù)服務(wù)的。 CMDB實現(xiàn)的作用:提供準(zhǔn)確的IT對象及關(guān)系的數(shù)據(jù)服務(wù)。 其他系統(tǒng)如監(jiān)控,事件管理、自動化運維,運維分析等和CMDB之間的關(guān)系,都是訪問CMDB的數(shù)據(jù)關(guān)系,ITSM流程比較特殊,如變更流程通過后,變更執(zhí)行完成,需要修改CMDB。 哪些數(shù)據(jù)要放到CMDB中?我們的原則是最小化原則,分析自己的業(yè)務(wù)需求,一直認(rèn)為哪些數(shù)據(jù)是其他系統(tǒng)要去訪問的,就放入到CMDB中,如果未來需要增加,可以通過流程快速擴(kuò)展。 ■ 銀行CMDB項目上線后如何對運維工作進(jìn)行管理安排? @周航 某銀行 軟件架構(gòu)設(shè)計師: 配置管理工作各銀行都會制定配置管理相關(guān)的管理制度和實施細(xì)則,內(nèi)容主要涉及配置管理的管理范圍、崗位人員配置、工作職責(zé)等內(nèi)容。 一般情況下,配置管理的日常工作主要涉及如下三類崗位和內(nèi)容: 一 、配置管理員,牽頭配置管理的日常管理工作,其主要工作內(nèi)容包括: 1 從總體上管理和監(jiān)控配置管理流程的運行情況,確保配置管理流程高效運行、管控到位。 2 牽頭配置模型的建立、優(yōu)化,并維護(hù)配置數(shù)據(jù)庫,同時牽頭制定配置管理數(shù)據(jù)庫安全控制策略和審核策略。 3 牽頭為其他管理流程或工具提供接口,有效地利用配置管理數(shù)據(jù)庫,與各配置項負(fù)責(zé)人一起促進(jìn)配置數(shù)據(jù)消費場景。 4 負(fù)責(zé)根據(jù)審計、管理需求生配置成報表和數(shù)據(jù)分析。 5 負(fù)責(zé)引入新技術(shù)提高配置管理流程的自動化程度,以提升信息的完整性和準(zhǔn)確性。 6 牽頭制定配置數(shù)據(jù)標(biāo)準(zhǔn)。 二、配置項負(fù)責(zé)人,一般各應(yīng)用、系統(tǒng)、網(wǎng)絡(luò)、設(shè)備、機(jī)房等各專業(yè)條線獨立設(shè)定各自的配置項負(fù)責(zé)人,其主要工作內(nèi)容為: 1、牽頭本專業(yè)內(nèi)的配置項識別工作,協(xié)助配置管理員建立相關(guān)模型,并通過自發(fā)現(xiàn)、手工維護(hù)、數(shù)據(jù)同步等方式將數(shù)據(jù)維護(hù)在配置管理數(shù)據(jù)庫中。 2、牽頭本專業(yè)內(nèi)相關(guān)配置項的準(zhǔn)確性,當(dāng)數(shù)據(jù)存在問題的時候,牽頭進(jìn)行數(shù)據(jù)的修訂和整改。 3、根據(jù)本專業(yè)內(nèi)生產(chǎn)環(huán)境配置的穩(wěn)定情況和配置管理數(shù)據(jù)庫的審核結(jié)果,定期創(chuàng)建配置基線 4、協(xié)助配置管理員制定并維護(hù)配置數(shù)據(jù)標(biāo)準(zhǔn)。 5、梳理專業(yè)內(nèi)的配置信息需求,推進(jìn)各專業(yè)工具進(jìn)行配置場景化消費和使用。 三、配置項審核員,負(fù)責(zé)保證配置數(shù)據(jù)的準(zhǔn)確性,主要負(fù)責(zé): 1、牽頭明確配置管理數(shù)據(jù)審核的范圍,并制定審核計劃。 2、基于配置數(shù)據(jù)標(biāo)準(zhǔn),采用配置數(shù)據(jù)治理工具或手工對配置數(shù)據(jù)進(jìn)行審核和檢查,記錄審核發(fā)現(xiàn)的問題,并生成審核報告。 3、負(fù)責(zé)與配置管理員及配置項負(fù)責(zé)人溝通審核結(jié)果,并共同制定改善方案,并跟蹤整改結(jié)果,保證配置數(shù)據(jù)的準(zhǔn)確性。 配置管理的后期維護(hù)工作往往繁瑣而負(fù)責(zé),要配置管理員、各專業(yè)配置項負(fù)責(zé)人、配置項審核員共同協(xié)助,加強(qiáng)溝通,持續(xù)優(yōu)化改進(jìn)配置管理工作,主要重點關(guān)注: 1、結(jié)合用戶需求與運維環(huán)境的演變,及時調(diào)整優(yōu)化配置項模型,滿足日益增長的場景化實施需求。 2、以標(biāo)準(zhǔn)為基礎(chǔ),以檢查為手段,持續(xù)提升配置數(shù)據(jù)的完整性、準(zhǔn)確性和有效性。 @he7yong 研發(fā)工程師: CMDB在規(guī)劃階段應(yīng)該要思考CMDB的運維流程,在項目上線階段應(yīng)該要交付詳細(xì)的CMDB的運維手冊; 運維的管理流程,其中需要涵蓋CMDB的產(chǎn)品負(fù)責(zé)人,CMDB的配置經(jīng)理,CMDB維護(hù)人員,CMDB的審核人員,不同人員擁有不同的權(quán)限。 CMDB的歷史教訓(xùn),讓大多數(shù)企業(yè)明白自動化對CMDB的重要性,因為自動化可以大量減少CMDB手工運維的操作,并且保障CMDB數(shù)據(jù)的準(zhǔn)確性: 1.配置對象自動化發(fā)現(xiàn)工具,配置信息自動化獲取工具,配置數(shù)據(jù)自動化上報工具; 2.CMDB和資源交付自動化工具的整合,資源自動化交付后自動注冊到CMDB中; 3.CMDB配置數(shù)據(jù)跟蹤和審計自動化; 4.利用RFID等技術(shù),對配置自動化的收集等技術(shù); ■ 在產(chǎn)品選型過程中需要注意哪些要點? @周航 某銀行 軟件架構(gòu)設(shè)計師: 1、配置項自發(fā)現(xiàn)的組件豐富性,其已支持的數(shù)據(jù)庫、操作系統(tǒng)、中間件等組件是否包含銀行現(xiàn)有技術(shù)組件,如果產(chǎn)品默認(rèn)支持,整個項目實施周期和工作量會相對較小。 2、配置自發(fā)現(xiàn)的agent是否支持銀行現(xiàn)有的操作系統(tǒng)版本,特別是一個特殊的操作系統(tǒng)例如:HP-UX、Windows,Solaris等,如果不支持,需要慎重考慮;或考慮自發(fā)現(xiàn)功能與銀行本身的自動化產(chǎn)品進(jìn)行集成來替代。 3、配置自發(fā)現(xiàn)的agent的穩(wěn)定性和性能。配置信息采集過程中的性能需要評估和測試驗證,保證其在采集過程中對現(xiàn)有的系統(tǒng)損耗和影響最小。 4 豐富靈活的API服務(wù):包括標(biāo)準(zhǔn)的CI查詢和更新服務(wù)、關(guān)系查詢服務(wù)、變更信息實時推送等服務(wù),考慮到CMDB的建設(shè)要與銀行已有的監(jiān)控、自動化、ITSM、DevOps等產(chǎn)品進(jìn)行集成,其API靈活性和豐富性是選型的關(guān)鍵要點。
|
|