企業(yè)在突發(fā)災難性事件之時,災難恢復是企業(yè)保障業(yè)務連續(xù)性的最后一道防線。“災備系統(tǒng)七要素”是根據(jù)我國國情所做的細化,具有更強的可操作性。
業(yè)務連續(xù)性現(xiàn)已成為企業(yè)生存和發(fā)展的生命線,也是企業(yè)創(chuàng)造利潤、保障信譽、承擔社會責任的一個前提。由于信息化的發(fā)展,它在促進企業(yè)發(fā)展的同時也給企業(yè)帶來了一定的風險,因此探究信息系統(tǒng)的業(yè)務連續(xù)性保障問題成為一個重要課題。
在企業(yè)業(yè)務連續(xù)性保障中,涉及到對企業(yè)的生產(chǎn)、協(xié)作、管理、營銷等各環(huán)節(jié)。業(yè)務持續(xù)管理(BCM)是從全局,體系化、系統(tǒng)化、規(guī)范化的一套管理思想。
而企業(yè)在突發(fā)災難性事件之時,災難恢復是企業(yè)保障業(yè)務連續(xù)性的最后一道防線。經(jīng)歷過“911”事件之后,雙塔樓中的1200家公司中,有災難恢復的企業(yè)400家基本上能存活下來,而沒有災難恢復計劃(DRP)則面臨滅頂之災。這說明了災難恢復保障的重要性。根據(jù)某戰(zhàn)略公司的研究,國際重要信息系統(tǒng)停機可以造成每小時2.8-650萬元的損失,國際上知名的網(wǎng)上書店“亞馬遜”若停機一小時,就將損失56萬美元。
我國在2003年,由國家信息化領(lǐng)導小組發(fā)布了《關(guān)于加強信息安全保障工作的意見》。
2004年發(fā)布的《關(guān)于做好國家重要信息系統(tǒng)災難備份的通知》等重要文件都進一步將有關(guān)戰(zhàn)略進行了細化,并明確了金融、電信、證券、保險、民航、鐵路、稅收、海關(guān)等八大部門和廣電網(wǎng)、電信網(wǎng)、互聯(lián)網(wǎng)三大信息基礎(chǔ)設(shè)施等,都要做好災難恢復的需求分析工作和加速推進災難恢復基礎(chǔ)設(shè)施的建立。
應急預案七環(huán)節(jié)
根據(jù)國信辦文件精神,相關(guān)部門都認真做了對“應急預案”的工作。“應急預案”應包括災難恢復的需求與目標、內(nèi)部組織應對和分工、事件響應流程、演練與維護以及保障措施。
其中應急響應流程一般應包括七環(huán)節(jié):信息安全事件監(jiān)控、預警→信息安全事件通報→啟動應急預案→事件應急抑制→事件應急恢復→應急事后審計評估。
在這個流程中的第六步—“事件應急恢復”中可以采用本地的冷備份、溫備份、熱備份等多種恢復手段進行實施。但需要注意的是災難恢復則是“應急恢復”的最后一道防線,一定要保證“后墻不倒”,必須要對災難恢復給予足夠的重視。
信息工程災難恢復系統(tǒng)七要素
為了進一步令該項工作具有可行性,國家信息安全標準委員會將“信息系統(tǒng)災難恢復規(guī)范”已制定完成,進入報批階段。
該“規(guī)范”中將我國災難恢復等級分為六級(如表),與國際業(yè)界通行的“share78”等級相比,我國省略了“0級”,其它級別設(shè)置基本兼容,但我國的規(guī)范更本地化和具有可操作性,并提出了災難恢復的七要素。
災難恢復的分級可以讓實施災備工作的單位,更好的尋找災備投入和承受風險之間的一個科學平衡點。而我國推行的“災備系統(tǒng)七要素”是根據(jù)我國國情所做的細化,具有更強的可操作性。
七要素包括:數(shù)據(jù)備份、主處理系統(tǒng)、網(wǎng)絡(luò)通訊、災難恢復預案、運維管理、技術(shù)支持、基礎(chǔ)設(shè)施。這七個要素用于指導信息工程的災難恢復系統(tǒng)的建設(shè)。
實施策略
災難恢復體系由于存在災難的小概率、高風險;“災備”的高投入、低效率,“災備系統(tǒng)”的建設(shè)不易、維持更難特點,造成了領(lǐng)導者在災備工作中也常有決心難下的情況。為了指導實際工作,國信辦在2004年出臺的11號文件,提出了“統(tǒng)籌規(guī)劃、資源共享、平戰(zhàn)結(jié)合、等級災備”的原則。
首先要結(jié)合單位的實際對災難恢復工作做好需求分析。要從本單位所面臨的威脅與風險入手,評估信息資產(chǎn)及其服務的價值,分析業(yè)務的關(guān)鍵性、時效性,根據(jù)業(yè)務中斷的影響、系統(tǒng)終端可容忍的時限、系統(tǒng)中斷可容忍的數(shù)據(jù)丟失,確定各項業(yè)務恢復的優(yōu)先級和相關(guān)性。
其次要對災難恢復目標的參考點進行量化。這當中有以下五個參考點:系統(tǒng)恢復的時間間隔(RTO)、數(shù)據(jù)恢復點的滯后時間(RPO)、總成本的控制(TCC)、災備點距離的選擇及災備等級的確立。其中RPO決定數(shù)據(jù)恢復的質(zhì)量,具體可見成本/復雜度與恢復時間關(guān)系圖。
數(shù)據(jù)恢復是災難恢復的基礎(chǔ),要秉行“丟失可控、應用透明、成本可行”的原則??蛇x用數(shù)據(jù)存儲磁盤鏡像方案、主機軟件支持數(shù)據(jù)鏡像方案、數(shù)據(jù)庫鏡像方案、網(wǎng)絡(luò)存儲方案、磁帶庫方案等。
第三,選擇合適的模式進行建設(shè)?,F(xiàn)行的災備系統(tǒng)建設(shè)有三種模式:獨立建設(shè)、聯(lián)合共建、社會化服務。
發(fā)達國家的建設(shè)模式平均的比例為獨立建設(shè)占29%、聯(lián)合共建占15%,社會化服務占56%。進行災備建設(shè)的單位可根據(jù)自身業(yè)務規(guī)模、業(yè)務的關(guān)鍵性以及技術(shù)實力和財政能力來選擇災備系統(tǒng)建設(shè)的模式,同時要改善客觀現(xiàn)實。
最后,應注意災備系統(tǒng)的檢測與演練工作。一般原則而言,快速變化的企業(yè)3個月需演練一次,而一般企業(yè)一年進行演練一次即可。
檢測方式可分為呼叫檢測、桌面檢測、模擬檢測、實戰(zhàn)檢測等。在災難恢復的工作流程中應遵循:預警、通報、評估、宣告、啟動、結(jié)束六步驟。
對涉密系統(tǒng),要注重涉密信息系統(tǒng)和災備現(xiàn)場的災難恢復工作的特殊使命。要特別注意在災難現(xiàn)場、遷移過程數(shù)據(jù)保密對策。
雖然隨著2008奧運會的臨近,許多單位和企業(yè)認識到災備工作的重要性,并開始付諸實踐,但是從總體上來看我國信息系統(tǒng)災難恢復工作尚處于起步階段。
從整體上來看,需要各單位認真貫徹國信辦的相關(guān)文件,努力在政策、規(guī)范、標準、基礎(chǔ)設(shè)施等方面創(chuàng)建環(huán)境,力求實效,逐步推進該項工作。
現(xiàn)今我國災難恢復所采用的大型災備設(shè)施還多為國外廠商的產(chǎn)品,我國擁有自主知識產(chǎn)權(quán)的產(chǎn)品很少。這也是對我國產(chǎn)業(yè)界提出了新的要求:我國的相關(guān)產(chǎn)業(yè)也需要在災備工作中大膽創(chuàng)新、軟硬結(jié)合,形成具有自主知識產(chǎn)權(quán)的產(chǎn)品及產(chǎn)業(yè)鏈。