網絡機房停電應急預案

在學習、工作或是生活中,有時會發生突發事件,爲了避免造成重大損失和危害,時常需要預先制定應急預案。我們該怎麼去寫應急預案呢?以下是小編幫大家整理的網絡機房停電應急預案,歡迎大家分享。

網絡機房停電應急預案

網絡機房停電應急預案1

機房是我單位的重要場所,重要儀器、設備相對集中,一旦發生事故,會造成嚴重後果 。爲此特制定本應急預案。

一、觸電

(1) 一旦發生觸電事故,應迅速安全切斷電源,切忌直接接觸觸電者。

(2) 即刻撥打緊急電話120並通知相關領導,同時開展現場應急救護 。

二、火災

1、報警程序:

即刻通知領導及相關部門,根據火情大小如需報警立即就近用電話或手機報告消防中心(電話119).。

2、組織實施:

機房管理員一旦發現火情後,應即刻切斷電源,並使用滅火器撲救起火設備。

三、空調漏水

若空調系統出現滲漏水,應立即安排停用故障空調,清除機房積水,並及時聯繫設備供應方處理,同時臨時用電扇進行降溫。

四、設備發生被盜或人爲損害事件

( 1)發生設備被盜或人爲損害設備情況時,使用者或管理者應立即報告中心負責人,同時保護好現場。

( 2)中心負責人接報後,通知保衛處,一同覈實審定現場情況,清點被盜物資或盤查人爲損害情況,做好必要的影像記錄和文字記錄。

( 3)當事人應當積極配合公安部門進行調查, 並將有關情況向領導彙報。

五、機房停電

(1)接到長時間停電通知後,應及時發佈相關信息,部署應對具體措施。

(2)如遇臨時停電,且停電時間在3小時之內,管理員要檢查UPS是否正常工作,以確保機房設備的正常運行。。

六、網絡故障

(1)發生通信線路中斷、路由故障、流量異常等故障後,網絡管理員應及時查清通信網絡故障位置,隔離故障區域,組織相關技術人員檢測故障區域,逐步恢復故障區與服務器的網絡聯接,恢復通信網絡,保證正常運轉。

(2) 事態或後果嚴重的,應及時報告領導並請求協助解決。

七、不良信息和病毒事件

(1)發現不良信息或網絡病毒時,管理員應立即斷開網線,終止不良信息或網絡病毒傳播,並報告。

(2)中心負責技術人員應採取隔離網絡等措施,及時殺毒或清除不良信息,並追查不良信息來源。

(3)事態或後果嚴重的,應及時報告相關領導以及相關部門。

八、服務器軟件系統故障

(1)發生服務器軟件系統故障後,在確認安全的情況下,重新啓動故障服務器系統;重啓系統成功,則檢查數據丟失情況,利用備份數據恢復;

(2)若重啓失敗,應立即安排備份服務器啓用,並請求技術人員支援,作好技術處理。

九、注意事項:

第一、機房管理員要加強日常監控,及時處理、消除及上報安全隱患。

第二、備齊安全相關裝備。

第三、及時做好備份。

網絡機房停電應急預案2

核心機房電力的保障一直是維護體系的頭等重要事項,通過實施應急發電演練,建立了可靠的應急預案機制,最大限度的降低電源中斷對網絡傳輸質量的影響。現分享核心機房電源中斷應急預案,希望分公司儘快建立一套統一指揮、職責明確、反應迅速、處置有力的機房安全保障機制。

組織架構:

責任領導、工程維護、網絡監控、網絡運維、質量管理等相關人員。

機房電源系統說明:

1、機房電力是兩路三相四線制供電,進線線纜規格爲:RVV50x4+16x1銅芯護套線。

2、機房電源系統採用三級防雷系統,三級防雷分別位於電源進線端、UPS輸入前端。

3、機房現有兩臺60KVA-UPS電源,均處於正常運行狀態。

4、機房現有設備機櫃已編號,均通過UPS電源和市電供電,每個機櫃有獨立的20A空氣開關。空調、牆壁插座開關、應急燈、照明等都是單獨空開接市電。

5、運行中的UPS電源所帶負荷,在逆變運行狀態下能正常工作約4小時(已經過UPS放電測試)。

一、核心機房電源中斷預案

1、在接到停電通知的.情況下:

1)計劃性停電通知要確保綜合部、工維機房管理部對口人接到通知(提前將對口聯繫人備案在物業處),機房管理員接到計劃停電通知後,升級到調度中心進行信息發送,同步進行郵件通知相應應急小組成員。並與負責組長及責任領導電話告知,確保已經接收到本次停電的時間及可能發生的情況。

2)維部進行發電應急預案小組成員通知,提前做好機房發電預案要求的準備工作,將相應的發電機、連接線、人員安排到位,各司其職,隨時待命現場,做發電準備工作。確保停電時刻的電力安全及機房用電的保障措施,提前調度安排好相應人員做好保障用電的措施。

3)計劃停電時間開始後,馬上啓動應急發電操作,按照機房發電操作步驟實施階梯供電的步驟,恢復市電保障。並進行現場值守及設備工作確認,確保全部正常後電話告知調度中心及維護體系領導。

2、在沒有接到任何通知,突然發生停電的情況下:確認停電線路,停電時刻,停電時間等要素,啓動核心機房發電應急預案。

1)值班網管工作流程:

⑴值班網管監控到核心機房停電,第一時間告知工維部、網絡部、運維部應急小組組長。信息傳達到工維部機房管理員(一主一備),告知停電開始時間。要求在停電5分鐘內將消息傳達到調度中心,各應急小組組長。如無法聯繫上,進行升級到責任領導-工維部經理經理處。

⑵網管將停電信息電話傳達後,進行調度派單,確保全部的應急小組成員都收到本次故障停電的信息。然後進行機房中設備的檢查,包括:UPS設備主機、各核心設備、匯聚設備、服務器、語音系統等。檢查是否受影響。同時啓動機房降溫措施(降溫方案:初步爲加裝抽排風設備、增加大風扇排風形成熱量流動降溫)

⑶實時監控設備及UPS工作情況,包括:電量下降情況,設備工作正常情況,每15分鐘通報一次電量情況。

2)運維部應急工作流程:

⑴運維應急同事接到故障通告後,第一時間往停電現場趕,到現場配合網管/工維部門進行設備儀器的檢查、客服語音系統的保障,應急發電的協助。

⑵現場配合進行機房降溫散熱措施實施,實時檢查網絡設備的工作情況。

3)運營質量管理應急工作流程:

⑴調度中心值班人員接到網管監控調度信息後,第一時間將故障信息記錄併發故障通告到相關應急成員,並電話通知各應急小組組長是否知悉。

⑵進行客服調度系統的設備工作運行系統檢查,特別語音系統級坐席電腦,是否有問題,如發現工作系統有異常,及時與運維應急小組成員溝通,進行檢查處理。

⑶實時關注故障工單流程進度登記,配合應急小組進行人員調度通告。

4)工維部應急工作流程:

⑴機房管理員第一時間往停電現場趕,同時進行電話溝通供電公司、物業方等,諮詢停電原因,是屬於計劃性還是突發性停電,預計停電時長,將諮詢清楚的結果反饋到應急小組成員中,電話聯繫物業溝通好需要發電需求申請。

⑵工維應急小組組長接到時間後第一時間往停電現場趕,同時進行發電應急小組成員調度,安排第一時間到場工作開展,並升級通報告知主管領導,對口集團維護中心上報信息。

⑶工維應急小組成員接到停電時間後第一時間往停電現場趕,要求30分鐘內必須到場(住機房附近的人員往現場去,較遠同事可以進行打車往現場去),先行到處同事配合網管、運維同事啓動做好應急發電前的準備:連接線布放、接續、發電機發電前檢測油/電/水路檢查,確保正常。確保一切就緒後,確認可以進行發電操作後,按照發電操作流程進行發電恢復市電。

⑷網管將監控到停電的相應信息及級別同步發送到運營質量管理部調度崗,由調度崗將相應信息進行工維、運維、網絡關聯同事進行信息告知,同時報工維主管領導知悉。

5)應急機房發電操作流程:

⑴機房用電系統包括四方面:空調製冷、主/備UPS主機、照明系統、客服調度系統。

⑵發電前考慮4方面系統設備用電功率情況,爲保障發電機帶動的正常,不能進行同步供電,要區分優先恢復的步驟實施,確認發電機的工作正常。在發電前將需要供電的“空調製冷、主/備UPS主機、照明系統、客服調度系統”的市電輸入主開關關閉。防止同步啓動時發電機的無法供電保證。

⑶啓動發電機,檢測發電輸出電流通斷,待發電機運行穩定後。

第一步啓動空調製冷系統的市電輸入開關,運維應急小組成員重新啓動空調主機(空調因爲市電恢復後需要重新啓動)觀察空調製冷工作是否正常。

第二步啓動主UPS設備的市電輸入開關,觀察發電機運行穩定情況,主UPS主機工作穩定情況,網絡設備的工作正常與否。

第三步啓動客服系統的市電輸入開關,包括(客服坐席電腦、UPS設備、空調製冷等),觀察發電機運行穩定情況,設備恢復工作情況。

第四步啓動備UPS設備、市電照明的市電輸入開關,觀察發電機運行穩定情況,備UPS主機工作穩定情況,網絡設備的工作正常與否。

⑷發電機啓動,市電輸入正常後,網管將降溫系統的抽排風設備關閉,與運維同事進行所有設備的運行進行全面的檢查,確保設備已經是運行正常。

⑸發電機發起市電正常後,工維應急小組安排專人現場值守,及時關注發電機油量情況,同時與油品供應商確認油品配送要求及時間要求,並實時與供電部門確認市電恢復時間。

6)停電過程中突發事項預防:

⑴網管在停電時進行機房確認運行中的UPS工作組、設備組工作狀態。主/備UPS工作切換是否正常,在市電中斷時UPS是否已經開始進行供電保護。

⑵值班網管對機房中的所有設備進行全面檢查,確保所有的設備已經是有主備供電,市電中斷後UPS已經正常保障設備工作。同時對機房的溫度進行觀察,溫度是否突然升高。

⑶停電後,UPS處於逆變工作狀態,當班人員要每隔15分鐘觀察一次UPS的蓄電池容量、帶負荷情況、機房環境溫度,儘量使蓄電池容量大於60%,帶負荷小於85%(因爲已經有自購發電機應急,儘快要求短時間發起電,減少UPS的放電過度)。

⑷發現機房環境溫度大於26℃。當以上指標不能保證時,要及時向機房管理員彙報,同時上報責任領導知悉,網管預案小組成員經過慎重討論,適時採取關閉不必要網絡的網絡設備、加強通風降溫等措施儘量延長關鍵設備運行時間。