疫情突如其來,已成為全球各國共同面臨的重大挑戰(zhàn),國內(nèi)銀行業(yè)多年未經(jīng)歷過如此大規(guī)模系統(tǒng)性考驗,以及肩負在疫情中護航經(jīng)濟運行的使命。而臨近兩會召開,來自監(jiān)管的“重保”要求也隨之而至。但部分銀行對重大疫情場景下的信息系統(tǒng)突發(fā)事件應(yīng)急預(yù)案之前考慮的并不完備。本文提出若干思考,探討重大疫情場景下,如何完善更具時效性、可行性、聯(lián)動性、系統(tǒng)性的應(yīng)急預(yù)案,進一步提升業(yè)務(wù)連續(xù)性管理能力。
敬畏與反思
2020年伊始,一場席卷全球的新型冠狀病毒疫情席卷了全球很多國家,給包括中國在內(nèi)的世界各地人民的生產(chǎn)及生活都造成了巨大的影響。全球矚目的新銳歷史學(xué)家尤瓦爾•赫拉利在他的著作《未來簡史》中用數(shù)據(jù)、事實和推理告訴我們,人類已經(jīng)戰(zhàn)勝了曾經(jīng)的三大挑戰(zhàn):饑餓、瘟疫、戰(zhàn)爭?,F(xiàn)在看來,赫拉利有些高估人類了。毫無疑問,本次疫情在全球迅速蔓延的嚴酷現(xiàn)實需要我們深刻的反思,并要永懷對自然和生命的敬畏之心。
▲根據(jù)世衛(wèi)組織統(tǒng)計數(shù)據(jù),截至歐洲中部夏令時間5月17日18時42分,全球確診新冠肺炎4534731例,死亡307537例。(圖片來源:新聞聯(lián)播)
春節(jié)過后,復(fù)產(chǎn)復(fù)工
春節(jié)過后,疫情防控形勢依舊非常嚴峻,根據(jù)國家各級部門對復(fù)產(chǎn)復(fù)工的防控要求,銀行主要采取了交錯排班、縮短營業(yè)時間、臨時關(guān)閉網(wǎng)點等防控措施。隨著社會各界相繼復(fù)工,金融服務(wù)需求逐漸回歸常態(tài),幾個月以來,疫情防控對人們生活的習慣、辦理業(yè)務(wù)的習慣或多或少產(chǎn)生某些影響,部分原線下習慣的客戶已經(jīng)習慣線上,這在一定程度上減緩了線下網(wǎng)點壓力,但隨著線上業(yè)務(wù)量的增長、線上客戶群體結(jié)構(gòu)的變化,對線上系統(tǒng)承載能力及穩(wěn)定性均提出更高的要求,也對線上系統(tǒng)支持的業(yè)務(wù)范圍與用戶體驗也提出新的要求。公眾與市場對金融機構(gòu)在突發(fā)疫情下的保障服務(wù)水平形成新的預(yù)期。對銀行而言,確保突發(fā)疫情下能夠快速進行應(yīng)急應(yīng)對與業(yè)務(wù)恢復(fù),維持符合公眾與市場預(yù)期的服務(wù)水平,避免影響社會與金融穩(wěn)定,這一能力的構(gòu)建顯得刻不容緩。
臨近兩會,運行保障
時間飛逝,轉(zhuǎn)眼五一假期已過,臨近兩會召開之際,來自監(jiān)管的“重保”要求也隨之而至,保障信息系統(tǒng)安全穩(wěn)定運行是重中之重。正所謂“居安思危,思則有備,有備無患”,要做好保障工作,尤其是如何有效應(yīng)對信息系統(tǒng)突發(fā)事件,這就需要我們持續(xù)加強應(yīng)急管理,細化應(yīng)急場景,完善應(yīng)急預(yù)案。首先是要識別和定義應(yīng)急場景,然后才是有針對性的制定相應(yīng)的應(yīng)急預(yù)案,由此可見,全面準確的識別并定義應(yīng)急場景是有效應(yīng)急處置工作的前提,但了解下來,部分銀行對重大疫情場景下的信息系統(tǒng)突發(fā)事件應(yīng)急預(yù)案之前考慮的并不完備,甚至并沒有仔細認真的思考并專項設(shè)計過。所以就再看看《商業(yè)銀行業(yè)務(wù)連續(xù)性監(jiān)管指引》(銀監(jiān)發(fā)[2011]104號)(以下簡稱“104”號文)中對重要業(yè)務(wù)運營中斷事件的定義。
監(jiān)管要求,分析解讀
在104號文第一章總則第四條中對重要業(yè)務(wù)運營中斷事件的定義,包括了四個方面,分別是:
信息技術(shù)故障。信息系統(tǒng)技術(shù)故障、配套設(shè)施故障:
這也是銀行信息系統(tǒng)IT基礎(chǔ)架構(gòu)規(guī)劃設(shè)計最為基本的要求,即防范規(guī)避信息系統(tǒng)故障,保障信息系統(tǒng)安全穩(wěn)定運行。通常是通過高可用架構(gòu)來實現(xiàn),要消除SPoF(Single Point of Failure),傳統(tǒng)的高可用架構(gòu),一般是通過主備、集群或負載均衡技術(shù)實現(xiàn)信息系統(tǒng)的高可用架構(gòu)。因涉及各個技術(shù)棧的不同層面,采用技術(shù)手段也不盡相同,傳統(tǒng)“IOE”技術(shù)架構(gòu)與互聯(lián)網(wǎng)開源技術(shù)架構(gòu)也有不同,這里先不做具體展開。
外部服務(wù)中斷。具體可參見《銀行業(yè)金融機構(gòu)信息科技外包風險監(jiān)管指引》銀監(jiān)發(fā)[2013]5號。這也是這幾年監(jiān)管檢查與評級的重點之一。
人為破壞。人為破壞具體可分為外部和內(nèi)部。內(nèi)部人為破壞,更多的是非主觀操作失誤,例如因變更實施導(dǎo)致的生產(chǎn)事故。而外部人為破壞,104號文中描述的“黑客攻擊“等,隸屬網(wǎng)絡(luò)信息安全防護范疇,這幾年持續(xù)開展的護網(wǎng)行動,就是防范該類風險、加強信息安全風險處置能力的具體舉措,更是國家應(yīng)對網(wǎng)絡(luò)安全問題所做的重要布局。104號描述的”恐怖襲擊“,具體仍可從防范樓宇級風險入手,即根據(jù)監(jiān)管要求開展重要信息系統(tǒng)同城災(zāi)備系統(tǒng)建設(shè)。
自然災(zāi)害。104號文中談到了火災(zāi)、雷擊、海嘯、地震、重大疫情等,其中火災(zāi)、雷擊尚屬樓宇級災(zāi)難,亦可通過同城災(zāi)備系統(tǒng)保障重要信息系統(tǒng)業(yè)務(wù)連續(xù),但海嘯或地震就比較嚴重了,局部地理區(qū)域可能都會受到嚴重影響,所以監(jiān)管層面對銀行提出異地災(zāi)備建設(shè)的要求。
重大疫情場景
這里重點說一下重大疫情場景。本次疫情突如其來,形勢演變至今,已成為全球各國共同面臨的重大挑戰(zhàn)。這場疫情為行政、醫(yī)療、衛(wèi)生等公共服務(wù)體系和幾乎所有國民經(jīng)濟行業(yè)帶來一次“大考”。金融行業(yè)并非受疫情直接影響最嚴重的行業(yè),但由于國內(nèi)銀行業(yè)多年未經(jīng)歷過如此大規(guī)模系統(tǒng)性考驗,以及肩負在疫情中護航經(jīng)濟運行的使命,銀行務(wù)必保持良好的業(yè)務(wù)連續(xù)性和強執(zhí)行力。因此,要以此為契機,完善更具時效性、可行性、聯(lián)動性、系統(tǒng)性的應(yīng)急預(yù)案,進一步提升業(yè)務(wù)連續(xù)性管理能力。
■開展BIA業(yè)務(wù)影響分析
在這次疫情發(fā)生后,需結(jié)合重大疫情場景,有針對性開展一次全面的RA風險分析和BIA業(yè)務(wù)影響分析,對可能受疫情影響的業(yè)務(wù)與管理活動,確定一個基本框架,一旦出現(xiàn)突發(fā)隔離情形,可以快速決策部署。在BIA的基礎(chǔ)上明確相應(yīng)應(yīng)急場景對應(yīng)的RTO和RPO。對BIA業(yè)務(wù)影響分析工作的開展,有相應(yīng)的方法論和工具,這里篇幅所限不做展開。
■完善BCP業(yè)務(wù)連續(xù)性計劃
區(qū)分不同疫情場景,整合可用資源,構(gòu)建針對性的業(yè)務(wù)連續(xù)性計劃,完善應(yīng)急預(yù)案,尤其需重點制定以下事項安排:一是要細化明確在有限的防疫、人力、保障資源情況下的業(yè)務(wù)恢復(fù)優(yōu)先次序;二是要落實業(yè)務(wù)連續(xù)性計劃,在總體統(tǒng)籌下,制定服務(wù)保障(允許服務(wù)降級)措施、非接觸式服務(wù)啟用、非現(xiàn)場辦公模式啟用、替代服務(wù)渠道啟用、電子服務(wù)渠道引導(dǎo)、業(yè)務(wù)流程調(diào)整等具體應(yīng)急預(yù)案;三是要結(jié)合疫情防控的主動隔離要求,靈活采用模擬性、實戰(zhàn)性等多種形式制定業(yè)務(wù)連續(xù)性計劃及應(yīng)急預(yù)案的演練測試安排。
■細化應(yīng)急預(yù)案
加強應(yīng)急管理,細化疫情防控場景下的應(yīng)急預(yù)案,針對特定場景有效組織應(yīng)急演練是數(shù)據(jù)中心疫情防控工作中不可或缺的一環(huán)。所有的預(yù)案不僅要做到場地設(shè)備、人員角色、響應(yīng)流程、技術(shù)工具的全覆蓋,要考慮到銀行數(shù)據(jù)中心多地多中心的特點,以及疫情防控場所隔離要求等情況。要充分考慮極端情況可能帶來的運維風險,設(shè)定不同的應(yīng)急場景并制定相應(yīng)的應(yīng)急預(yù)案,確保數(shù)據(jù)中心在疫情緊急突發(fā)情況下能夠迅速、有序地開展應(yīng)急工作,控制和防止事故進一步惡化。
■開展實戰(zhàn)演練
針對疫情防控特點及要求,開展實戰(zhàn)演練,充分驗證數(shù)據(jù)中心應(yīng)急響應(yīng)機制,檢驗應(yīng)急預(yù)案的有效性,時效性、應(yīng)急流程的可行性及整體方案的完備性。
▲恒豐銀行實施疫情防控實戰(zhàn)演練(圖片來源:中國經(jīng)濟網(wǎng)/恒豐銀行總行公眾號)
■建立“零信任”安全架構(gòu)的遠程協(xié)同平臺
舉國上下幾個月的疫情防控,各地采取延遲復(fù)工、隔離管制等疫情防控措施,給大家的生活及工作方式也帶來了很大的影響。最初的復(fù)產(chǎn)復(fù)工也是要避免人員聚集,保持社交距離,因此更多采用遠程辦公和協(xié)同的方式。在疫情防控特殊時期,銀行數(shù)據(jù)中心為保障生產(chǎn)安全穩(wěn)定運行,尤其是應(yīng)急響應(yīng)、處置、協(xié)同,通過有效的工具平臺來保障接入安全、協(xié)同有效、數(shù)據(jù)安全、操作安全。即需要構(gòu)建“零信任”安全架構(gòu)的遠程協(xié)作平臺,通過遠程VPN接入,嚴格集中訪問控制,在安全合規(guī)的基礎(chǔ)上,實現(xiàn)遠程安全登入,利用雙因素認證,按照最小授權(quán)、按需開通、從嚴審核、及時關(guān)閉等要求,進行用戶訪問控制,加強事前審核審批、事中實時監(jiān)控與事后合規(guī)審計。采取加密傳輸、數(shù)據(jù)不落地訪問等措施防范數(shù)據(jù)泄露風險,確保運維操作事前可審、事中可控、事后可查。滿足疫情防控期間現(xiàn)場與居家、本地與異地協(xié)同運維操作應(yīng)急處置需求,為異常情況快速有效有序的應(yīng)急響應(yīng)創(chuàng)造有利條件。
■多措并舉,確保業(yè)務(wù)持續(xù)運營
通過管理(業(yè)務(wù)連續(xù)性管理、應(yīng)急管理)和技術(shù)手段(工具平臺),有效應(yīng)對重大疫情場景對銀行的影響與威脅,保障銀行數(shù)據(jù)中心的人員安全、業(yè)務(wù)連續(xù)性和信息系統(tǒng)安全,持續(xù)提升數(shù)據(jù)中心運行保障能力,確保銀行業(yè)務(wù)系統(tǒng)持續(xù)運營。