EVO-DR災備自動化管理系統

行業背景

 

 

銀監會在《商業銀行數據中心監管指引》中明確要求“商業銀行每年至少進行一次重要信息系統專項災備切換演練,每三年至少進行一次重要信息系統全面災備切換演練,以真實業務接管為目標,驗證災備系統有效接管生產系統與安全回切的能力,并且積極建設自動化運維工具平臺,逐步達到 75% 的自動化覆蓋率”。

為滿足監管規定和業務連續性要求,各商業銀行計劃在實現手工災備切換的基礎上,逐步建設災備自 動化運維平臺,實現災備切換的標準化、可控化、自動化和可視化,降低人工操作風險,提高切換效率和 切換成功率,實現災備切換的自動、可控、安全、高效,全面提升商業銀行面對突發事件時的應急處理能力。

如何保障業務系統服務的連續性,減少服務中斷帶來的經濟損失和信譽影響,是銀行管理層和監管部 門共同關心的話題。因此各商業銀行陸續建設兩地三中心的災備體系,以便在生產中心出現故障時及時接管生產業務,減少業務中斷時間。中亦科技 EVO-DR 災備自動化管理平臺基于多年災備建設運維的經驗基礎上,結合災備體系的監管要求,實現災備演練切換過程的標準化、流程化、可控化、自動化和可視化, 形成的統一的災備管理工作支撐平臺。該平臺可以結合業務視角定期評估,持續改進災備管理工作,進一 步提升數據中心災備管理的整體水平,充分提升 IT 價值和業務連續性。

 

 

用戶痛點

 

 

• 災備切換跨多部門協作才能完成,過程復雜周期長 ;

• 切換過程操作復雜流程繁多,對人員能力素質依賴度較高,誤操作風險較高 ;

• 人工切換時間不可控,難以保證RTO 目標 ;

• 缺乏實時動態全局指揮決策工具,無法把控整體切換過程;

• 無法實時展現災備切換過程中業務的變化情況。

 

 

核心功能

 

 

 

★ 災備切換可視化

 

向各層級人員提供切換過程及系統運行情況的分類展示,保障災備系統滿足管理、協作、切換、運維等不同場景下進行跨團隊協作、信息同步、進度實時查看、切換過程動態實時展現等要求。

行級領導示圖:

 

 

科技部領導示圖:

 

 

工程師操作示圖:

 

 

★ 災備切換可控化

 

•   流程管理:基于中亦科技自主研發的調度引擎 EVO-Flow,通過可視化拖拉拽方便實現各種災備演練及災備切換流程的定義和配置,支持串行、并行、分支、人工干預以及節點跳轉,整個執行過程支持可 視化動態展示;對執行過程中產生的日志信息進行動態顯示和記錄,以便進行實時跟蹤以及事后回溯分析。

•   場景管理:災備切換場景的全生命周期管理,實現災備切換中各種場景的定義、修改和維護管理, 一般分為災備演練和災備切換兩種場景類型,進一步按照業務系統梳理定義各自的演練場景。

•   預案管理:提供對災備切換預案分類管理和協同維護等功能,緊急情況發生可快速激活預案并通知預案相關人員,提升決策效率。

•   演練管理:提供全流程的演練管理,包括演練預案管理、演練計劃管理、演練流程管理、演練實施過程管理、演練結果評估管理等。

 

★ 災備切換自動化

 

•   切換前檢查:切換啟動前系統自動比對生產與災備環境一致性,保障切換任務順利實施。

•   一致性檢查:支持定期自動比對生產與災備環境同步情況,保障災備中心系統配置一致性。

•   切換自動化:提供災備切換過程管理,在切換前可發送短信、郵件等消息通知相關人員,可視化展 示切換流程進度,切換過程中可按需進行人工干預(暫停、終止、繼續、跳轉、人工干預、斷點續做等), 保障切換的順利完成。

•   切換報告自動生成:演練切換或災難切換完成,自動生成災備切換報告,記錄事件發生及切換全過程,可將報告在線編輯并下載。

 

 

產品優勢

 

 

★大屏展現:切換過程動態大屏展現,為決策層、指揮層、操作層提供全方位動態視圖展現,主要包括切換過程以及相關業務指標的動態展現。

★內置大量最佳實踐:基于中亦科技多年大型數據中心運維經驗,平臺內置大量運維最佳實踐,腳本3000+、組件1000+,涉及主流的操作系統、數據庫、中間件、網絡、負載均衡等。

★預案管理:應急預案和切換預案定制,實現切換決策有據可依、指揮快捷高效、操作自動安全可

靠。

★自動生成報告:容災切換演練、真實切換報告自動生成,可根據報告及演練評估結果進行有針對性的改進。

 

 

客戶收益

 

 

★提高靈活性:加快業務對異常情況的響應速度,快速調整,快速應對,提升應變能力;

★降低風險:符合監管規定,降低人為操作風險 ;

★提升效率:提升切換效率,降低人員協調溝通成本 ;

★控制成本:降低人工依賴,控制運營成本,優化人力資源和系統結構 ;

★切換專業化:實現災備切換過程的標準化、自動化、可控化和可視化。

 

 

案例分享

 

 

★ 項目背景

 

某商業銀行已完成兩地三中心災備體系建設,核心業務系統 100 多套,涉及主機、網絡、存儲 2000 多臺,每年進行兩次切換演練,但是由于基礎架構復雜涉及技術產品繁多,傳統的切換方式以人工方式為主, 導致每次切換參與人數眾多、各種狀況頻發、難以實現預期的 RTO 目標,效率低下過程復雜結果不可控。

 

★ 項目目標

 

•    實現災備切換預案中技術切換、回切部分的標準化、流程化和自動化,包括系統、網絡設備及應用切換,切換系統包括 AIX、Linux、windows 平臺、DB2、Oracle、各種中間件、各類網絡設備、安全設備和負載均衡;同時滿足切換步驟轉人工處理(包括步驟報錯轉人工、直接轉人工等場景);

•   完成 ECC 大屏展示內容的設計、實施工作,實現災備系統切換過程中的 ECC 大屏全屏展現,直觀顯示切換進度、各系統狀態及其他相關信息,包括但不限于切換過程的狀態變化、關鍵業務指標、性能指標、針對不同角色展現不同的示圖內容等;

•   實現核心業務系統的災備自動化切換,切換過程動態展現;

•   實現災難切換預案管理和災難切換報告的自動生成及導出;

•   實現切換流程的可視化拖拉拽定義,支持串行、并行、分支、跳轉、斷點續做和人工干預等;

•   實現多切換場景的流程配置;

•   實現生產與災備配置的一致性檢查并能夠自動同步。

 

★ 項目難點

 

•   災備切換預案不完整,切換流程、步驟、命令沒有及時更新,無法直接使用;

•   客戶技術人員配合不到位,嚴重影響項目進度;

•   缺乏必要的測試環境,無法提前進行有效的技術驗證;

•   生產和災備環境不一致,影響實際切換無法順利進行。

 

★ 實施過程

 

↓ 安排運維經驗豐富的實施工程師,詳細梳理每套業務系統的切換流程、步驟、命令和腳本,形成完善的切換操作手冊,提交客戶審批確認;

↓ 跟客戶技術人員梳理完善災備切換場景預案;

↓ 搭建必要的測試環境,對于核心步驟和腳本進行充分測試,對于核心系統進行主備切換測試;

↓  部署災備自動化平臺,按照梳理好的切換步驟和災備預案,定義每套業務系統的切換流程和切換場景;

↓ 實現每年兩次的自動化切換。

 

★ 客戶收益

 

★切換流程依賴關系固化在平臺中, 一鍵式自動化執行;

★自動化和管理流程結合;

★統一的災備切換管理指揮平臺;

★災備切換過程動態可視化展現;

★簡化操作過程,降低人員依賴度和人工操作失誤的概率;

★提升工作效率,整體切換時間可以縮短50%-70%。

 


鍛造凝煉IT服務 助推用戶事業發展
地址:北京市西城區百萬莊大街11號糧科大廈3層
電話:(010)58523737
傳真:(010)58523739
彩神帝