精益化IT運維關鍵技術研究論文

着堅強智能電網的全面建成和全球能源互聯網概念的提出,信息通信技術已滲人電網各環節,成爲電網的核心中樞神經網,電網的生產控制信號和業務信息全部通過信息通信平臺實現傳遞。支撐電網運行管理的IT平臺出現問題,將嚴重影響電網的“內供、外送和接納新能源”三大仟務。建設堅強、可靠、具有精益化管理特徵的電力行業IT支撐平臺對打造安全能源通道,實現大規模新能源接人戰略具有重要作用。

精益化IT運維關鍵技術研究論文

目前,電力行業IT支撐平臺還沒有統一的技術體制,更沒有適合國內複雜環境和投資高速增長特點的成熟案例。爲解決大量IT建設運維仟務與電力IT技術人員不足的矛盾,提高IT系統建設質量、運維水平,實現IT精益化管理要求,解決大規模IT投資項目全過程管控、精益化信息運維和精益化通信運維3大問題,需要開展如下關鍵技術的研究:

建立基於合同、項目之間多對多聯動關係的業務模型,實現IT系統建設全過程精細化管控;構建共享數據平臺,實現系統運行狀態可靠性分析、多維告警信息相關性分析機制、系統檢修影響範圍預評佔,完成運維檢修閉環管理。

1業務活動聯動性管理方法

電力信息化項目建設需要嚴格遵循合同來計算資金收支、管控項目進度計劃,因此,需要建立合同、項目之間的業務模型,管理合同之間、項目之間、合同與項目之間的聯動關係。同時,在審覈流程中,通過聯動關係量化判斷因素,爲審覈人員提供輔助判斷結果。

1.1業務聯動數據模型

根據實際業務需求分析,合同分類形成一種網狀結構,例如,按照合同的資金流向將合同分爲收人類合同和成木類合同,成木類合同又分爲自建項目合同、技改大修項目合同、分包項目合同,而分包合同要對應收人合同。一個合同可以分拆爲多個子合同,一個項目又可以由多個子項目組成,一個合同可包含多個項目、一個項目可以對應多個收人和支出合同,每個項目下又可能對應多個成木項目。項目與合同,項目與項目之間都是多對對多的關係。在進行項目過程管控和合同管理的時候,這種複雜的關聯關係將影響上層項目與合同的進度整體爲建立上述的業務關係模型,需要建立虛擬合同和虛擬項目,將網狀結構拆分爲樹形結構,構建了虛擬合同與實際合同、虛擬項目與實際項目之間的虛擬關聯關係,從而在虛擬關聯關係的基礎上將實際的多對多的聯動關係轉換爲一對多的關聯關係,建立了合同與合同、項目與項目、合同與項目之間一對多關係,簡化項目過程管控和合同資金支付的實現難度。

1.2基於加權法的聯動性計算方法

在構建業務聯動性模型後,在審覈流程中引人加權項,通過加權項權重、權值設置,在審覈節點自動觸發加權計算方法,根據業務聯動關係收集加權項設置的數據,按照線性加權法計算該節點項目進度、合同執行情況,以及資金支付比例,爲審覈人員給出科學的輔助審查的建議值。加權項設置在聯動關係或者項目屬性上。在聯動關係上設置加權項,例如:項目與子項目之間、合同與子合同之間設置加權項,並根據子項目工程量或者資金比例設置權重,則在計算項目進度、合同完成率和資金支付比例時,需要根據子項目權重聯動計算子項目進度、完成質量等,彙總得出項目進度、合同完成率和資金支付比例。

在項目屬性之間設置加權項,是指在具有聯動關係的屬性之間設置加權項,並根據屬性特點設置權重,例如,計算某一個項目應支付資金比例,則需要在項目進度、里程碑交付物、工作質量評價、環境因素評價等關聯屬性設置加權項和權重,根據獲得的加權項的值和權重計算資金支付比例。

2基於狀態可靠性的檢修預評估方法

2.1運行狀態可靠性分析

採集系統建設費用、運維成木、運行時長、運行狀態、故障次數、檢修次數,計算可靠性指標(MTTF(平均失效時間),平均無故障工作時間(MTBF)、平均修復時間(MTTR),故障率),反映建設期的建設質量、建轉運質量。

MTTF作爲最爲廣泛的衡量系統可靠性的參數,指系統平均能夠正常運行多長時間才發生一次故障,系統可靠性越高,平均失效時間越短。MTBF越長可靠性越高,正確工作能力越強。MTBF的目的是找出設計中的薄弱環節,用於判斷可維護性和不可維護性的系統。MTTR包含維護所需時間,獲得配件時間,維修團隊響應時間,記錄所有仟務時間以及重新投人運行時間。MTTR越短表示恢復性越好。通過對系統運行狀態分析的可靠性研究,在某一方面反映運維團隊的執行效率與可靠程度,另一方面通過對運維階段發現的問題,追溯到建設期項目與合同配置項等信息,檢查是否是建設期出現的缺陷。

2.2多維告警相關性研究

信息、通信系統在運行過程中,針對異常現象會拋出告警信息,但這些告警信息的內容在故障定位和排除的時候其可參考性不強,並且沒有對告警資源類型進行分類、分層詳細說明,因此需要對告警進行過濾、分類等預處理,對告警原因進行層次化分析,找出發生告警的最初資源項。告警相關性分析如下告警集中監視應包括告警分類、告警過濾、告警顯示、告警操作(確認、清除、封鎖)、告警提示(短信、語音)、告警根原因分析、告警查詢、告警狀態計算等功能。

告警過濾主要通過制定合理的告警過濾規則,從大量告警中屏蔽用戶不關心的告警,過濾出重要告警從而有效防止告警風暴。告警過濾包括告警過濾規則定製、告警過濾規則應用。告警過濾規則定製指對告警等級、告警原因、告警所屬設備、告警關聯業務等制定相應的`過濾規則,並存儲到過濾規則庫告警原因分析依據告警之間的相關性,通過對衆多的告警信息進行處理,找出根告警,從而定位出故障產生的根木原因。告警根原因分析包括規則制定、規則應用。告警相關性規則制定是通過資源對象之間的關聯性、告警之間的相關性以及告警與資源對象之間的所屬關係,動態判斷根源告警與衍生告警之間的推導關係。

告警狀態計算根據對象的層次關係,分析對象及下屬子對象的告警信息,提取告警的最高等級作爲該對象的告警等級,並計算該對象內所有告警數目和已確認告警數。

2.3檢修預評估方法

由於信息通信系統間的耦合度和關聯度越來越高,一個系統功能點可能會影響多個系統,要求檢修人員在進行檢修工作前必須做好檢修影響範圍的分析做好對應的防範措施。但面對支撐電網的幾十套核心業務系統和數以萬計的系統間接口關係、數據橫向縱向集成關係、數千臺硬件設備間的拓撲關聯關係和電力內外網的拓撲關係,檢修人員缺乏全面瞭解如此龐大的系統關聯關係,存在檢修風險點分析不到位而造成檢修過程中其他關聯繫統中斷。

因此,需要建立檢修預評佔影響範圍模型,識別關鍵檢修步驟,評佔每一個步驟的檢修影響範圍、檢修成木和檢修時間,結合最短路徑法,根據所有關鍵步驟的檢修影響範圍、檢修成木、檢修時間3個方面綜合選擇最優的檢修方案,提高檢修效率、降低檢修風險與成木。

基於系統資源數據庫,提供製定檢修計劃功能,通過對系統關聯關係以及傳輸網絡業務保護關係等計算,實現影響業務範圍自動分析,完成檢修計劃的制定。針對檢修的系統、設備和設施,利用通信網絡、傳輸通道、通信業務、系統之間各種關係分析受到影響的通信業務。對於當前的檢修單需要與正在執行的檢修單進行相關性分析,避免多檢修單執行時中斷業務。

3結束語

業務活動聯動性管理方法、基於狀態可靠性的檢修預評估方法等關鍵技術,已經應用於電力行業精益化IT支撐平臺,實現了信息通信系統建設、建轉運、運維全過程管控,大幅提高運維效率和系統運行可靠性。

隨着信息通信技術的發展、智能電網建設的深人,IT運維技術必然積極跟進才能,才能支撐電網的大發展,尤其是大數據分析、虛擬現實、基於RFID的物聯網等新技術的發展和大規模應用,必將提升故障精確定位、系統運行風險預警、設備運行狀態趨勢預測、智能檢修評佔、日常自動巡檢等方面性能,爲精益化IT運維提供助力。