從信息工程監(jiān)理角度看IT運維管理
技術支持服務電話:15308000360 【7x24提供運維服務,解決各類系統(tǒng)/軟硬件疑難技術問題】
1.引言
經(jīng)過十年的信息化發(fā)展,國內(nèi)很多行業(yè)的很多單位都已經(jīng)實現(xiàn)了一定程度的信息化。在大規(guī)模的信息化建設完成后,將面臨長期的系統(tǒng)運行維護的問題。在IT項目的生命周期中,大約80%的時間與IT項目的服務和運營有關。
如何維護已經(jīng)建成的信息系統(tǒng),成為信息化建設走向良性循環(huán)發(fā)展軌道的重點。作為信息工程監(jiān)理單位,一般完成項目驗收就結束了監(jiān)理工作,但隨著市場需求的不斷擴大,監(jiān)理公司順應市場,已經(jīng)將業(yè)務擴展到了運維階段的監(jiān)理,本文將說明信息工程監(jiān)理如何進行IT運維管理。
2.IT運維現(xiàn)狀
根據(jù)高德納咨詢公司(GartnerGroup)的調(diào)查發(fā)現(xiàn),在經(jīng)常出現(xiàn)的問題中,源自技術或產(chǎn)品(包括硬件、軟件、網(wǎng)絡、電力失常及天災等)方面的問題其實只占了20%,而流程失誤方面的問題占40%,人員疏失方面的問題占40%。流程失誤包括變更管理沒有做好、超載、沒有測試等程序上的錯誤或不完整,人員疏失包括忘了做某些事情、訓練不足、備份錯誤或安全疏忽等。
圖2-1IT系統(tǒng)出現(xiàn)故障原因分析圖
從世界范圍看,IT部門面向內(nèi)部的最終客戶提供服務的歷程可以分為四個階段,如圖2-2所示:
圖2-2IT部門演變歷程圖
第一階段是救火隊階段,哪里出了問題趕快派人到哪里,有時候會忙得焦頭爛額,響應也不及時,打電話找不到人,最終客戶滿意度不高;第二階段是為了提高客戶滿意度,很多企業(yè)逐漸設置了專門的熱線服務,受理故障申告后,及時安排工程師處理,跟蹤故障處理過程及時反饋最終客戶,客戶滿意度逐漸提高;第三階段是集成的服務和運行中心階段,其顯著特征是在HELPDESK的基礎上,進行了幾個方面的優(yōu)化和改進:一是在故障處理的基礎上進行了問題管理,采取措施分析故障根源,解決故障隱患,二是服務過程流程化,三是增加了變更管理、資產(chǎn)配置管理、服務水平SLA管理等內(nèi)容。同時,必須有一個良好的服務管理系統(tǒng)的支持,不僅僅是網(wǎng)管監(jiān)測系統(tǒng),服務臺/服務熱線在接到客戶的保障后,馬上就知道當月已經(jīng)發(fā)生的故障歷時,并確定這次故障的優(yōu)先級別;第四個階段是主動維護管理和自動維護管理。IT系統(tǒng)能夠自動報告,SLA與其對業(yè)務的影響緊密相關。
目前,中國的很多企業(yè)還處于第一、二階段,刻不容緩的工作是對客戶的服務要盡快提升到一個更高的水平。
3.信息化管理體系建設內(nèi)容
IT運維管理體系要真正發(fā)揮效益,避免“為技術而技術”,需要融合人、流程、技術。根據(jù)信息化的發(fā)展要求,賽迪監(jiān)理認為配套的管理措施應包括組織模式、管理制度、管理流程、績效考核、運維費用、技術支撐等內(nèi)容。
3.1組織模式
監(jiān)理單位應協(xié)助信息中心從全局的角度定位IT運行維護和服務工作,將中心目前分散進行的各項IT運行維護和服務的工作職能逐漸整合,進行集中統(tǒng)一管理,統(tǒng)一調(diào)度IT運行維護和服務的技術力量,并結合信息中心實際情況和管理需要進行配套的組織機構的設置和逐步完善。
第一,成立IT運維管理領導小組。初期可以成立由信息中心領導和各處(室)負責人組成的IT運維管理協(xié)調(diào)小組,從總體上負責IT運行維護和運維管理的統(tǒng)一組織協(xié)調(diào),監(jiān)督檢查各處室服務質(zhì)量;將來根據(jù)IT運維管理發(fā)展,可以成立由部領導、中心領導和業(yè)務司局領導組成的信息化治理領導小組。
第二,建立面向用戶的服務接口。初期以服務臺為統(tǒng)一服務接口,不斷擴充與完善服務臺的功能,統(tǒng)一受理客戶的IT服務請求,記錄問題并及時解決,對解決不了的較為專業(yè)的問題派發(fā)給專業(yè)的技術人員,各相關處室提供技術支持,并明確相關技術支持人員及職責;將來逐步建立獨立的IT運行維護和服務機構(運維中心),專門負責IT運維和服務工作,合理劃分建設與運維的邊界,實現(xiàn)建設與運維的分離。
第三,設置合理的組織機構。初期保持目前組織機構和職責不變,進一步理順關系;將來隨著信息化發(fā)展和管理成熟度的不斷提升,逐步建立起完全適應體系運行的IT治理組織機構。
3.2管理制度
賽迪監(jiān)理認為管理制度是指IT運行維護和服務工作必須遵循的內(nèi)部管理規(guī)定,用于提高工作的協(xié)調(diào)性和管理的有效性。借鑒IT運維管理體系國際標準標準ISO20000要求,管理制度分為“綱領性辦法”、“分項辦法”、“實施細則或操作指南”和“配套表單”四個層次,見圖3-1。
圖3-1管理制度級別圖
第一級:制定涵蓋信息中心IT運維管理全過程的綱領性總體辦法《IT運維管理辦法》,作為指導IT運維管理工作開展的統(tǒng)領,內(nèi)容涵蓋IT服務全過程的管理控制點和人員管理等核心內(nèi)容,包括IT運維管理模式、歸口管理、組織結構與職責、人員崗位與職責、IT運維管理工作規(guī)劃與執(zhí)行、預算保障、績效評價等方面的管理規(guī)定。
第二級:結合IT服務的實際情況,針對管理工作需要而制定的具體管理分項辦法,范圍涵蓋系統(tǒng)、網(wǎng)絡、機房、桌面、設備備品備件及耗材、文檔等,明確管理職責與規(guī)范操作流程。
第三級:在第二級分項辦法的基礎上,按照精細化管理需要,對某些方面的運行維護工作的具體實施過程與操作程序做出的細化準則或指南。
第四級:配合第一、二、三級制度的執(zhí)行而配套制定的表單等,用于記錄、備案人、物、行為等信息。
3.3管理流程
管理流程是指為達到既定的IT運維管理目的而組織起來的邏輯上相關的有規(guī)律性并可重復的活動。賽迪監(jiān)理認為可以借鑒IT運維管理國際最佳實踐ITIL,將IT運維管理分為服務支持和服務交付兩大部分;根據(jù)信息中心的管理需要,分階段建立相關流程。先期建立服務臺和事件管理、問題管理、變更。
3.4績效考核
為實現(xiàn)IT服務精細化管理的目標,提高管理制度和管理流程的執(zhí)行力,賽迪監(jiān)理認為績效考核是非常重要的管理手段;績效考核從信息中心IT運維管理體系的目標出發(fā),按照體系、流程和崗位角色分解,形成IT運維管理體系關鍵績效指標(KPI)-流程KPI-角色崗位KPI”三層相互關聯(lián)的績效考核指標體系,見下圖3-2。
圖3-2三層績效考核體系
3.5運維費用
運維費用是IT運維管理體系持續(xù)運行的資金保障。隨著信息化建設的逐漸深入,信息化工作將逐漸由建設轉向以應用為主的運行維護階段。為保障業(yè)務應用系統(tǒng)的有效運行和IT服務質(zhì)量的提高,實現(xiàn)IT服務精細化管理的目標,為業(yè)務提供信息化支撐,科學進行運維費用管理非常重要;
運維費用管理清晰定義運維費的構成要素,規(guī)范運維費用預算的口徑和標準,使其與信息化建設費用、日常公用經(jīng)費區(qū)分。在運維費預算的基礎上,要按照中心財務制度規(guī)范運維費預算的執(zhí)行,保障運維工作有序開展?;陬A算執(zhí)行結果,進一步指導信息中心運維管理工作,最終實現(xiàn)“運維預算-核算(預算執(zhí)行)-結算”全過程管控。 3.6技術支撐
監(jiān)理在執(zhí)行運維監(jiān)理過程中主要利用技術支撐體系進行監(jiān)控,包括以下三個層次:展示層、流程及業(yè)務運維管理層、集中監(jiān)控層。
展示層:提供對用戶的IT運維管理界面與對技術人員的體系管理控制界面,在運維管理界面上實現(xiàn)集中運維的統(tǒng)一管理功能和信息展示與交互。
流程及業(yè)務運維管理層:在集中運維管理模式下實現(xiàn)流程執(zhí)行和管理控制功能、業(yè)務運維管理功能。
集中監(jiān)控層:通過監(jiān)控工具實現(xiàn)對不同服務對象和IT資源的實時監(jiān)控,包括主機、數(shù)據(jù)庫、中間件、存儲備份、網(wǎng)絡、安全、機房、業(yè)務應用(以下簡稱“應用”)和客戶端等技術支撐管理子系統(tǒng),并通過集中監(jiān)控管理平臺對不同被管對象的技術支撐管理子系統(tǒng)進行綜合處理和集中管理。
4.賽迪監(jiān)理對ITIL的初探
4.1背景
作為2001年由英國政府計算機和電信中心(CCTA)整合而來的英國商務部,從20世紀80年代開始就致力于研究和解決“IT服務質(zhì)量不佳”的問題。1989年,CCTA發(fā)布了一套10卷本的IT服務管理指南,這10本書系統(tǒng)地介紹了根據(jù)“最佳實踐”歸納和總結的10大IT服務管理核心流程,這就是ITIL1.0版本。
2001年,OGC對ITIL1.0進行了修訂和擴充,將原來的10本指南合編為《服務提供》和《服務支持》兩本書(共同構成ITIL6大模塊中的“服務管理模塊”)。此外,增加了應用管理、安全管理等其他5個模塊。這6個模塊構成了ITIL2.0版本。
20世紀90年代后期,ITIL的思想和方法,被美國、澳大利亞、南非等國家廣泛引用,并進一步發(fā)展。2001年英國標準協(xié)會(BritishStandardInstitute)在國際IT服務管理論壇(itSMF)年會上,正式發(fā)布了以ITIL為基礎的英國國家標準BS15000。
2002年,BS15000為國際標準化組織(ISO)所接受,作為IT服務管理的國際標準的重要組成部分。目前,ITSM領域正成為世界IT巨子、政府、企業(yè)和各界專家廣泛參與的新興領域,對未來的IT走向和企業(yè)信息化,將會產(chǎn)生深遠的影響。
4.2對ITIL的理解
ITIL作為一種以流程為基礎、以客戶為導向的IT服務管理指導框架,它擺脫了傳統(tǒng)IT管理以技術管理為焦點的弊端,實現(xiàn)了從技術管理到流程管理,再到服務管理的轉化。
在ITSM(IT服務管理)領域,受到廣泛關注和歡迎的企業(yè)信息化“最佳實踐”,是以“流程”為主線,以標準化為框架,以管理為核心的。
ITIL核心包括IT服務提供(ITServiceDelivery)和IT服務支持(ITServiceSupport)兩大體系,如圖所示,ITIL的核心是服務管理模塊,即服務支持和服務提供兩個子模塊中包括的十個典型服務管理流程和一個服務管理職能。
圖4-1ITIL核心示意圖
4.3服務支持流程之間的關系
服務支持流程主要面向用戶(End-Users)。它用于確保用戶得到適當?shù)姆找灾С纸M織的業(yè)務功能。服務支持流程包括,體現(xiàn)服務接觸和溝通的服務臺職能和5個運作層次的流程,即事件管理、問題管理、配置管理、變更管理和發(fā)布管理。這5個服務管理流程的主要職能是,確保IT服務提供方(ITServiceProvider)所提供的服務質(zhì)量,符合服務級別協(xié)議(SLA)的要求。
圖4-2服務支持流程之間關系圖
事件管理:所謂事件是指任何不符合標準操作、且已經(jīng)引起或可能引起服務中斷和服務質(zhì)量下降的事件。事件管理的目的就是在出現(xiàn)事件時盡可能快地恢復服務的正常運作,避免其造成業(yè)務中斷,以確保最佳的服務可用性級別。為了實現(xiàn)這個目的,事件管理流程必須最佳地利用資源支持業(yè)務、開發(fā)和維護有效的事件記錄以及設計和應用統(tǒng)一的事件報告方法。
問題管理:問題是導致一些或多起事件的潛在原因,問題管理就是盡量減少服務基礎架構、人為錯誤和外部事件等缺陷或過失對客戶造成影響,并防止它們重復發(fā)生的過程。發(fā)生事件并不一定表明存在問題,問題也不一定要等發(fā)生事件后才能發(fā)現(xiàn)。
事件管理和問題管理的目標是相同的,但兩者的側重點不同。前者是強調(diào)“盡快恢復服務”,為此可以采取各種各樣的措施,包括一些臨時性的措施;而后者強調(diào)“從根本上解決問題”,即讓事件不再發(fā)生,或者即使發(fā)生也有很好的應對措施。
變更管理:變更是指對IT基礎架構組件(包括硬件、網(wǎng)絡、軟件、應用、環(huán)境、系統(tǒng)及相關文檔)進行增加、修改或移除。變更管理的目的是使用標準方法和規(guī)程來快速有效地處理所有變更,以減少事件對服務的影響。
配置管理:配置管理是識別和確認系統(tǒng)的配置項,記錄和報告配置項狀態(tài)和變更請求,檢驗配置項的正確性和完整性等活動構成的過程,其目的是提供IT基礎架構的邏輯模型,支持其它服務管理流程特別是變更管理和發(fā)布管理的運作。為此,配置管理需要計量所有IT資產(chǎn),為其它流程提供準確的信息,為事件管理、問題管理、變更管理和發(fā)布管理提供基礎,驗證基礎架構記錄并在必要時糾正有關記錄。
發(fā)布管理:發(fā)布(版本)是指一組經(jīng)過測試后導入實際運作環(huán)境的新增的或經(jīng)過改動的配置項。發(fā)布管理的目的是為了保證發(fā)布的成功,主要應用于大型的或關鍵硬件、主要軟件及打包或批處理一組變更。
4.4服務提供流程之間的關系
服務提供流程主要包括服務級別管理、IT服務財務管理、能力管理、IT服務持續(xù)性管理和可用性管理5個服務管理流程。由于這些管理流程必須解決“客戶需要什么”、“為滿足客戶需求需要哪些資源”、“這些資源的成本是多少”、“如何在服務成本和服務效益(達到的服務級別)之間選擇恰當?shù)钠胶恻c”等問題,因而服務提供所包括的這5個核心流程均屬于戰(zhàn)術層次的服務管理流程。
圖4-2服務提供流程之間的關系圖
服務等級管理:服務等級管理是有關定義、協(xié)商、簽訂和測評提供給客戶的服務的質(zhì)量水準的流程。服務等級協(xié)議中說明了有關所提供的服務和這些服務的質(zhì)量水準,并規(guī)定了服務雙方各自的責任、權利和義務。服務等級管理是IT服務成功運作的重要保障。
就像服務臺是服務支持各流程的“聯(lián)系點”一樣,服務等級協(xié)議是服務提供各流程的連接處,它定量說明了IT服務過程中的財務、持續(xù)性和可用性等方面的數(shù)據(jù)指標,并規(guī)定當這些定量指標沒有被滿足時的處理方法。同時,服務等級協(xié)議還詳細說明了處理事件的升級方法。
IT服務財務管理:IT服務財務管理是負責預算和核算IT服務提供方提供IT服務所需的成本,并向客戶收取相應服務費用的管理流程。
IT服務財務管理流程包括IT投資預算、IT服務成本核算和服務計費三個子流程,其目標是通過量化服務成本減少成本超支的風險、減少不必要的浪費、合理引導客戶的行為,從而最終保證所提供的IT服務符合成本效益的原則。IT服務財務管理流程產(chǎn)生的預算和核算信息可以為服務級別管理、能力管理、IT服務持續(xù)性管理和變更管理等管理流程提供決策依據(jù)。
IT服務持續(xù)性管理:IT服務持續(xù)性管理是指確保發(fā)生災難后有足夠的技術、財務和管理資源來確保IT服務持續(xù)性的管理流程。IT服務持續(xù)性管理關注的焦點是在發(fā)生服務故障后仍然能夠提供預定級別的IT服務,從而支持組織的業(yè)務持續(xù)運作的能力。因此,IT服務持續(xù)性管理必須立足于組織的業(yè)務持續(xù)性管理。
可用性管理:可用性管理是通過分析用戶和業(yè)務方的可用性需求并據(jù)以優(yōu)化和設計IT基礎架構的可用性,從而確保以合理的成本滿足不斷增長的可用性需求的管理流程。
可用性管理是一個前瞻性的管理流程,它通過對業(yè)務和用戶可用性需求的定位,使得IT服務的設計建立在真實需求的基礎上,從而避免IT服務運作中采用了過度的可用性級別,節(jié)約了IT服務的運作成本。
能力管理:能力管理是指在成本和業(yè)務需求的雙重約束下,通過配置合理的服務能力使組織的IT資源發(fā)揮最大效能的服務管理流程。
能力管理流程包括業(yè)務能力管理、服務能力管理和資源能力管理三個子流程,其中業(yè)務能力管理子流程主要關注當前及未來的業(yè)務需求,服務能力管理子流程主要關注當前IT服務的品質(zhì)是否能夠支持正常的業(yè)務運作,而資源能力管理子流程主要關注所有服務提供賴以進行的技術基礎,確保IT基礎設施中所有組件能發(fā)揮最大的效能。
5.結束語
本文從國內(nèi)到國外信息化發(fā)展趨勢來看,充分說明了信息化工程的未來市場將著眼于運維管理服務,因此,信息化監(jiān)理工作在運維階段的作用充分體現(xiàn)出實質(zhì)性監(jiān)理的工作水準,賽迪監(jiān)理將監(jiān)理工作從過去的全天候監(jiān)理轉型為全過程實質(zhì)性監(jiān)理,利用超前的工作理念,先進的管理工具,結合多年的項目經(jīng)驗立足于信息化后時代中。