最近有不少客戶因為想了解 ITIL,而注冊了 ServiceHot ITSM 系統(tǒng)。這其中有的對 ITIL 已經(jīng)很熟悉了,而有的還不甚了解。本文邀請了 ServiceHot 的顧問試著把 ITIL 講清楚。
大多數(shù)企業(yè)在運維管理的過程中會遇到這樣那樣的問題,比如:運維太雜亂了,感覺任何事情都跟自己有關(guān)!這就對了,說明用戶對運維組織的依賴性已經(jīng)存在了,這是好事!但是雜亂顯然不是好事,所以需要我們梳理服務(wù)目錄以及制定事件分類。
再比如:這么多機器要管,我哪有時間去做盤點,還要時刻關(guān)注有沒有過了維保的設(shè)備。這就需要我們建立配置管理數(shù)據(jù)庫,根據(jù)配置的資產(chǎn)屬性搭建資產(chǎn)的生命周期管理流程,結(jié)合數(shù)據(jù)庫這項技術(shù)自身的特點,匯總統(tǒng)計分析也就不在話下......相信世界的實踐,ITIL被譽為運維管理的圣經(jīng),并非浪得虛名。
無論哪一種管理被導(dǎo)入到一個企業(yè)的前期,思想都是最重要的一個環(huán)節(jié)。一種新的理念要被相信,是需要實踐去證明的,在我們做體系設(shè)計時,一些“異己分子”總是抱著懷疑的態(tài)度和眼光,但往往能參與設(shè)計的“異己分子”卻是體系執(zhí)行時比較重要的環(huán)節(jié),所以大部分咨詢顧問在做ITIL實施落地時,需要與這些同事你來我往,唇槍舌劍。其實大可不必,在體系真正落地之后運轉(zhuǎn)一段時間,真理即被檢驗!在這之前,不管是咨詢顧問還是ITIL小白,只需要知道 ServiceHot 顧問總結(jié)的五點,就可能讓我們達成共識。
一、ITIL是一種方法論而已
IT基礎(chǔ)架構(gòu)庫(ITIL-ITInfrastructureLibrary),被譽為IT服務(wù)管理的圣經(jīng),其中包含了總結(jié)國際大公司在IT服務(wù)管理中的經(jīng)驗并得到證明的IT服務(wù)計劃和運營的最佳實踐框架。從20 世紀(jì)80 年代末期至今,ITIL已推出3個版本,從相關(guān)標(biāo)準(zhǔn)上,也從BSI15000發(fā)展到ISO20000,它的指導(dǎo)意義毋庸置疑。
作為眾多國際大型企業(yè)成功實踐的積累,ITIL使我們找到了解決運維流程規(guī)范的方式和方法??墒?,如何更好地運用ITIL這一經(jīng)典的方法論呢?我們認(rèn)為應(yīng)該注意兩點:
1.ITIL是從實踐中得來的精髓,不是僵化的教條,應(yīng)該結(jié)合實際情況去運用ITIL,建立更加適合企業(yè)自身的流程規(guī)范,而不是照抄照搬。
2.由于ITIL理論博大精深,不可能在短期內(nèi)在企業(yè)中全面實施。應(yīng)該根據(jù)實際情況,選取實施重點,逐步實施,逐步完善。
實際上,只是強調(diào)一點,我們做ITIL應(yīng)該講究實事求是,結(jié)合企業(yè)的實際情況,理解、運用ITIL的核心理念,結(jié)合企業(yè)現(xiàn)狀,解決核心和關(guān)鍵問題,逐步實現(xiàn)對運維的科學(xué)管理。
二、實踐是檢驗真理的唯一標(biāo)準(zhǔn)
ITIL理論必須要與實際情況相結(jié)合,注重工作流程細(xì)節(jié)的設(shè)計和優(yōu)化,是體系建設(shè)的關(guān)鍵。理順工作流程、提高服務(wù)效率是新運維系統(tǒng)建設(shè)的主要內(nèi)容之一。
在工作流程的制定過程中,容易陷入以下兩個極端。
1.盲目照搬流程。作為方法論的ITIL,本身含有大量的成功實踐框架。但是,正如前面所說的,ITIL是從實踐中得來的精髓,不是僵化的教條,盲目照搬,只能使得工作流程不切合實際,并流于形式,對系統(tǒng)的貫徹和執(zhí)行產(chǎn)生不好的影響。
2.完全遵照現(xiàn)有流程,實現(xiàn)其電子化。雖然這樣更符合目前的工作習(xí)慣,可能容易為運維人員所接受,但是,仍然解決不了目前運維所存在的一些問題。例如,我們在項目實施中曾遇到“工單在部門之間的重派”的問題。在當(dāng)前手工作業(yè)的工作模式中,各單位將不屬于本單位處理范圍的工單,或部門需要其他部門配合的工單,均提交給故障處理的負(fù)責(zé)人,由該負(fù)責(zé)人向其他單位進行轉(zhuǎn)派和重派。這種處理方式,主要便于手工作業(yè)條件下負(fù)責(zé)人及時了解項目處理狀況。在建立運維系統(tǒng)后,負(fù)責(zé)人可以通過運維系統(tǒng)隨時了解到故障的處理狀況,每次重派和轉(zhuǎn)派之前,對負(fù)責(zé)人的回復(fù)變成了一種無效的工作,大大降低了事件的處理效率。如果僅僅將目前的手工作業(yè)電子化,那么故障處理的效率仍然沒有得到有效的提高。
因此,將ITIL理論與實際情況相結(jié)合,注重工作流程細(xì)節(jié)的設(shè)計和優(yōu)化,是系統(tǒng)建設(shè)的關(guān)鍵。
三、從被動向主動的轉(zhuǎn)變
從被動向主動式的運維一直是所有運維團隊共同的愿望。在現(xiàn)行的運維工作中,我們經(jīng)常遇到這樣的情況:一方面是運維部門疲于應(yīng)付各種突發(fā)事件,加班加點處理各種重復(fù)事件,工作繁重,身心疲憊;一方面是客戶代表不斷抱怨和投訴“技術(shù)人員服務(wù)水平太低”。二者不可調(diào)和的矛盾,是新運維系統(tǒng)要解決的重要問題。
傳統(tǒng)的運維方式給人的印象是:故障發(fā)生前,維護人員似乎無所事事;故障發(fā)生后,則是手忙腳亂。這就是被動服務(wù)給人們留下的印象,運維人員是在被動地等待故障的發(fā)生。在新的運維系統(tǒng)中,我們必須改變原有的運維方式,變被動服務(wù)為主動服務(wù)。
在主動服務(wù)模式下,運維人員主動地監(jiān)控系統(tǒng)的變化,對日常工作及故障處理完成后主動進行問題分析,對系統(tǒng)的變更風(fēng)險進行評估。在新運維管理模式中,可以通過種種技術(shù)措施,使得運維工作從被動服務(wù)轉(zhuǎn)移到主動服務(wù),如:增加變更管理流程以防范變更風(fēng)險。
在日常運維工作中,變更工作是在所難免的。例如,新的系統(tǒng)安全漏洞被公布,為了保證系統(tǒng)安全,就需要安全系統(tǒng)補丁,而這種變更給系統(tǒng)帶來的風(fēng)險則是難以估計的。例如在安裝補丁后,有時會產(chǎn)生大量莫名其妙的問題。這么一個簡單的例子已經(jīng)可以說明,如果沒有很好的風(fēng)險防范手段,系統(tǒng)變更將給我們的日常運維工作帶來大量的問題,后果往往是難以想象的。在新系統(tǒng)中,我們可增加變更管理流程。在變更管理流程中,變更方案需提交變更經(jīng)理,由變更經(jīng)理組織由專家組成的變更顧問委員會(CAB)對變更進行風(fēng)險評估,在評估通過后才能夠進入變更的實施過程。變更管理是防范變更風(fēng)險的最好辦法。
當(dāng)然,主動服務(wù)是一種理念,在這種理念下,我們可以定義更多的流程,如問題管理流程,對系統(tǒng)中存在的隱患問題進行挖掘,防患于未然??傊?,我們應(yīng)該樹立這樣一個理念,在各流程的定義中進行運用,主動地提早發(fā)現(xiàn)系統(tǒng)存在的風(fēng)險和隱患,減少突發(fā)事件的發(fā)生。
四、從平臺到業(yè)務(wù)的全面管理
網(wǎng)絡(luò)管理是運維系統(tǒng)的組成部分。對系統(tǒng)的監(jiān)控也是運維的主要業(yè)務(wù)之一。以往網(wǎng)管系統(tǒng)實現(xiàn)了對平臺的監(jiān)控,可是在實際運維工作中,平臺往往只有少數(shù)的幾個系統(tǒng)管理員負(fù)責(zé),大多數(shù)業(yè)務(wù)人員更多地是面對業(yè)務(wù)系統(tǒng)。對于業(yè)務(wù)的監(jiān)控和管理,是業(yè)務(wù)人員更加關(guān)心的問題。因此,在網(wǎng)管系統(tǒng)中,應(yīng)加入業(yè)務(wù)監(jiān)控的內(nèi)容。
需要注意的是,業(yè)務(wù)是建立在平臺的基礎(chǔ)之上的,而不是孤立存在的。因此,監(jiān)控中,應(yīng)強調(diào)業(yè)務(wù)監(jiān)控與平臺監(jiān)控密不可分的聯(lián)系,從業(yè)務(wù)的角度出發(fā),建立平臺與業(yè)務(wù)的關(guān)聯(lián)關(guān)系。在故障發(fā)生時,應(yīng)能夠即時描述對業(yè)務(wù)的影響程度,能夠描述故障的影響范圍。
例如:采集源的某臺交換機產(chǎn)生異常,除了可以看到交換機告警外,我們還應(yīng)該能夠在業(yè)務(wù)拓?fù)鋱D中直觀看到,還有哪些基于這些網(wǎng)絡(luò)的業(yè)務(wù)系統(tǒng)受到影響,同時采集、預(yù)處理、分揀等相關(guān)業(yè)務(wù)也不同程度受到影響。其影響程度,能夠通過不同的顏色直觀地展示出來。
只有這樣才能夠更加直觀而全面地反映系統(tǒng)的運行狀態(tài),反映業(yè)務(wù)的運行情況。能夠幫助運維人員在故障發(fā)生時,快速修復(fù)關(guān)鍵部件,減少故障帶來的損失。
五、績效應(yīng)以KPI為導(dǎo)向
提到KPI,不僅僅是工程師,甚至很多管理者都會誤入考核的誤區(qū)。好吧,KPI(Key Performance Indicator)的直譯確實是關(guān)鍵績效指標(biāo)。但我們更愿意把它當(dāng)做一個方法,一個建立壓力層層傳遞的指標(biāo)體系的方法。
假設(shè):我們制定了變更管理流程,但是,變更管理沒有被很好地執(zhí)行,而只是流于形式,則風(fēng)險的防范也只能是停留在理論上的空談。所以,在運維系統(tǒng)建設(shè)過程中,建立了一整套科學(xué)的考核制度,以激勵運維人員更有效地提高服務(wù)質(zhì)量和服務(wù)水平,是至關(guān)重要的。
對運維人員的考核,并不能就管理論管理,應(yīng)該從客戶服務(wù)的角度出發(fā),以客戶滿意為前提,進行考核。例如,根據(jù)每個部門的服務(wù)水平,制定了服務(wù)時限。假設(shè),某個用戶投訴,需要多個部門協(xié)同進行處理。在處理過程中,各部門互相推托,雖然工單在各部門的停留時間沒有超過部門承諾的時限,而整體處理時間已經(jīng)超過了運營商對該用戶承諾的處理時間。為了杜絕這種現(xiàn)象的出現(xiàn),我們應(yīng)該從用戶的角度出發(fā),進行各部門處理時間的分段計算。計算結(jié)果將反映在每月故障處理情況的統(tǒng)計報告中,而這些報告直接與各部門、各單位的績效考核掛鉤。
通過這樣的考核機制,形成對員工日常工作的科學(xué)評價,既調(diào)動了員工積極性,又提高了工作效率和服務(wù)質(zhì)量。
同樣,考核機制的建立也需要依據(jù)實際出發(fā),并不能一味考慮指標(biāo),更重要的是設(shè)計出來的指標(biāo)能不能起到改善提升的作用。
以上,是一些在ITIL實施之前,或者說我們需要做ITIL之前的一些基本的思想觀念,也是在實際中總結(jié)出來的一些經(jīng)驗,個人認(rèn)為值得與大家分享,更愿意以此引發(fā)討論。
不管ITIL到底是什么,對于大多數(shù)企業(yè)而言,它的必要性顯而易見:它能夠幫助IT部門提高用戶的滿意度和運行效率,“有了ITIL后,我們能夠在任何時間點評估我們的成果?!?/span>
關(guān)于ServiceHot
ServiceHot ITSOM基于ITIL流程框架打造服務(wù)流程管理功能,能夠滿足企業(yè)對事件管理、問題管理、變更管理、發(fā)布管理、配置管理、服務(wù)級別管理的各種需求,幫助企業(yè)實現(xiàn)對運維服務(wù)質(zhì)量、過程、技術(shù)和資源的全方位管理。結(jié)合企業(yè)的實際情況,ServiceHot理解、運用ITIL的核心理念,幫助其解決核心和關(guān)鍵問題,逐步實現(xiàn)企業(yè)對運維的科學(xué)管理。
ServiceHot 專注于IT服務(wù)運營管理,是國內(nèi)領(lǐng)先的ITSM軟件廠商和ITSOM云服務(wù)平臺提供商,同時也是全球ITSM2.0倡導(dǎo)者以及ITSOM(IT服務(wù)運營管理)全球定義者。
ServiceHot 提供基于ServiceHot ITSM2.0(IT服務(wù)管理系統(tǒng))、ServieHot ITSOM(IT服務(wù)運營管理平臺)、ServiceHot RM 遠程運維平臺的產(chǎn)品級服務(wù)和 SaaS 云服務(wù)。
ServiceHot 以“服務(wù)管理”為核心,應(yīng)用場景橫跨了IT服務(wù)運營管理成熟度從高到底的要求,為數(shù)據(jù)中心及運維部門、IT部門實現(xiàn)服務(wù)的可視、可控、可管。其客戶涉及到金融、制造、醫(yī)療、政府、物流、互聯(lián)網(wǎng)、服務(wù)業(yè)等全行業(yè),其中包含了大型企事業(yè)有中移動、中石油、首鋼、長虹集團、ACER中國、中國體彩、新東方集團等。