隨著金融科技發(fā)展的日新月異,信息技術(shù)在銀行系統(tǒng)扮演的角色越來(lái)越重要,銀行業(yè)的日常穩(wěn)定運(yùn)營(yíng)與IT系統(tǒng)緊密相關(guān),信息技術(shù)早已成為與核心業(yè)務(wù)系統(tǒng)管理息息相關(guān)的重要要素。構(gòu)建安全、穩(wěn)定、有序、高效的IT運(yùn)維管理模式,是各商業(yè)銀行推動(dòng)業(yè)務(wù)系統(tǒng)穩(wěn)定運(yùn)行、加強(qiáng)自身競(jìng)爭(zhēng)能力的關(guān)鍵所在,對(duì)促進(jìn)商業(yè)銀行支付業(yè)務(wù)安全健康發(fā)展具有積極意義。
主要問(wèn)題
IT運(yùn)維管理是指基于網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè),在網(wǎng)絡(luò)設(shè)施的運(yùn)行狀態(tài)下,采用相對(duì)應(yīng)的管理方法,對(duì)物理網(wǎng)絡(luò)、軟硬件環(huán)境等運(yùn)行環(huán)境進(jìn)行維護(hù)管理的IT管理工作,實(shí)現(xiàn)完善的IT運(yùn)維管理是商業(yè)銀行提高經(jīng)營(yíng)水平和服務(wù)水平的關(guān)鍵。從調(diào)研情況看,目前商業(yè)銀行IT運(yùn)維管理工作存在一些問(wèn)題,制約了商業(yè)銀行IT運(yùn)維管理水平的進(jìn)一步提升。例如:IT運(yùn)維管理機(jī)制不完善,流程操作缺乏嚴(yán)肅性;運(yùn)維管理過(guò)度依賴科技人員,不能形成與統(tǒng)一業(yè)務(wù)目標(biāo)建設(shè)的合力;KPI關(guān)鍵績(jī)效指標(biāo)考核機(jī)制不完善,不能全面準(zhǔn)確反映真實(shí)的工作績(jī)效;缺乏管理工具,無(wú)法在IT運(yùn)維過(guò)程中提供全面、安全、穩(wěn)定的運(yùn)行支持;缺乏系統(tǒng)化的、詳盡的標(biāo)準(zhǔn)化建設(shè),簡(jiǎn)單的收集、梳理難以滿足未來(lái)企業(yè)IT信息化發(fā)展需要;突發(fā)事件的預(yù)警和告警無(wú)法實(shí)現(xiàn)統(tǒng)一可視化,導(dǎo)致IT運(yùn)維事件響應(yīng)來(lái)源不一,工作效率低下,突發(fā)事件應(yīng)急能力較低。
管理思路
從商業(yè)銀行IT運(yùn)維管理存在的問(wèn)題分析看,應(yīng)采取“三步走”模式逐步加以完善和改進(jìn):一是運(yùn)維服務(wù)流程梳理,對(duì)服務(wù)工作任務(wù)分解、排列,形成固定服務(wù)程序;二是在服務(wù)流程、規(guī)范這兩個(gè)維度形成“服務(wù)工作標(biāo)準(zhǔn)”,確保操作流程統(tǒng)一性;三是利用IT工具約束工作任務(wù),建立相應(yīng)的KPI關(guān)鍵性指標(biāo),準(zhǔn)確衡量服務(wù)質(zhì)量。
在此基礎(chǔ)下,從六個(gè)方面進(jìn)一步完善IT運(yùn)維管理平臺(tái)。一是搭建統(tǒng)一監(jiān)管平臺(tái)。通過(guò)搭建統(tǒng)一監(jiān)管平臺(tái),實(shí)現(xiàn)機(jī)房狀態(tài)、系統(tǒng)狀態(tài)、網(wǎng)絡(luò)吞吐、應(yīng)用日志等基礎(chǔ)監(jiān)控和業(yè)務(wù)監(jiān)控的統(tǒng)一管理,擺脫監(jiān)控產(chǎn)品多、監(jiān)控場(chǎng)景單一的處境。二是實(shí)現(xiàn)基礎(chǔ)設(shè)施全面監(jiān)控。采用專業(yè)的運(yùn)維監(jiān)控框架,結(jié)合行內(nèi)自身特點(diǎn)進(jìn)行適應(yīng)性匹配,實(shí)現(xiàn)所有設(shè)備實(shí)時(shí)監(jiān)控。三是分析、歸類、整合高效化。借助ELK技術(shù)將分散在服務(wù)器中的數(shù)據(jù)收集、分類;采用運(yùn)維監(jiān)控和ELK兩種采集方式,結(jié)合大數(shù)據(jù)手段,對(duì)數(shù)據(jù)進(jìn)一步分析、歸類、整合等,為IT運(yùn)維提供多種數(shù)據(jù)服務(wù)。四是數(shù)據(jù)分析的加強(qiáng)。利用互聯(lián)網(wǎng)成熟穩(wěn)定技術(shù)作為支撐,在統(tǒng)一監(jiān)控平臺(tái)基礎(chǔ)上,對(duì)各類監(jiān)控?cái)?shù)據(jù)指標(biāo)進(jìn)行數(shù)據(jù)處理、趨勢(shì)分析,降低風(fēng)險(xiǎn)發(fā)生概率。五是強(qiáng)化突發(fā)事件處置能力。統(tǒng)一監(jiān)控平臺(tái)可在突發(fā)事件中觸發(fā)告警,對(duì)常規(guī)操作謹(jǐn)慎自動(dòng)化嘗試處理,為突發(fā)事件的處理爭(zhēng)取時(shí)間。六是標(biāo)準(zhǔn)化與自動(dòng)化相結(jié)合。信息科技管理平臺(tái)與統(tǒng)一監(jiān)控平臺(tái)相互對(duì)接,通過(guò)標(biāo)準(zhǔn)化流程推動(dòng)自動(dòng)化處理,保障運(yùn)維合規(guī)化、標(biāo)準(zhǔn)化、自動(dòng)化流程。自動(dòng)化能力與標(biāo)準(zhǔn)化建設(shè)相輔相成,共同發(fā)展,為IT運(yùn)維管理提供全面支撐。
管理目標(biāo)
其一,自動(dòng)化業(yè)務(wù)監(jiān)控——風(fēng)險(xiǎn)提示。統(tǒng)一監(jiān)控平臺(tái)以微服務(wù)架構(gòu)模式,通過(guò)多個(gè)不同服務(wù)模塊對(duì)支付系統(tǒng)進(jìn)行實(shí)時(shí)監(jiān)控,如:查詢查復(fù)、頭寸、凈借記限額、止付業(yè)務(wù)、退匯、掛賬未受理情況等,通過(guò)大數(shù)據(jù)趨勢(shì)分析,規(guī)律性展示業(yè)務(wù)高發(fā)時(shí)段,提醒運(yùn)維人員提前做好風(fēng)險(xiǎn)防控。
其二,基礎(chǔ)環(huán)境信息收集——風(fēng)險(xiǎn)暴露?;A(chǔ)環(huán)境信息采集內(nèi)容不斷增多,通過(guò)統(tǒng)一監(jiān)控平臺(tái)反映出來(lái)的如影響性能或安全方面的隱患逐漸顯露,及時(shí)調(diào)整系統(tǒng)、網(wǎng)絡(luò)、應(yīng)用架構(gòu),盡早處理隱患,保障了支付系統(tǒng)的業(yè)務(wù)連續(xù)性,網(wǎng)銀交易超時(shí)率大幅降低。
其三,可視化信息查詢——風(fēng)險(xiǎn)靈活掌握??梢暬畔⒉樵円浴氨O(jiān)控隨行”為目標(biāo),實(shí)現(xiàn)多節(jié)點(diǎn)、自適應(yīng)、跨平臺(tái)、多端適配,信息隨行方式,使相關(guān)業(yè)務(wù)、技術(shù)人員隨時(shí)隨地查詢統(tǒng)一監(jiān)控平臺(tái)的監(jiān)控信息,使支付基礎(chǔ)環(huán)境、業(yè)務(wù)指標(biāo)、異常檢測(cè)通過(guò)預(yù)警、告警、可視化、數(shù)字化、自動(dòng)化和多展示、多處理形式,提高受理效率,保證支付安全。
相關(guān)建議
一是強(qiáng)化信息共享。IT運(yùn)維管理相關(guān)技術(shù)更新?lián)Q代速度較其它領(lǐng)域更快,相關(guān)技術(shù)人員需要接受的信息較多,加強(qiáng)信息的共享是避免出現(xiàn)技術(shù)盲區(qū)的有效手段之一。提供開(kāi)放的分享空間,使員工通過(guò)討論的方式分享自己的經(jīng)驗(yàn)與想法,加強(qiáng)信息流動(dòng)力的同時(shí)激發(fā)員工的創(chuàng)新思考精神,各部門(mén)間相互學(xué)習(xí),交流經(jīng)驗(yàn),從而達(dá)到增強(qiáng)整個(gè)IT運(yùn)維管理團(tuán)隊(duì)技術(shù)能力的目的,逐步擊破整個(gè)組織技術(shù)盲區(qū)。
二是加強(qiáng)運(yùn)維流程管理。進(jìn)一步完善運(yùn)維管理流程,健全運(yùn)維管理制度和標(biāo)準(zhǔn),通過(guò)建設(shè)全面的監(jiān)控管理平臺(tái)將各個(gè)業(yè)務(wù)系統(tǒng)中的各種設(shè)備、軟件、業(yè)務(wù)應(yīng)用均能納入到監(jiān)控平臺(tái)中來(lái),消除管理對(duì)象之間差別、消除數(shù)據(jù)采集手段的差別、消除管理軟件的差別,對(duì)各種不同來(lái)源數(shù)據(jù)統(tǒng)一處理、統(tǒng)一展現(xiàn)、統(tǒng)一用戶登錄、統(tǒng)一權(quán)限控制。
三是增強(qiáng)應(yīng)對(duì)突發(fā)事件能力。應(yīng)急演練是檢驗(yàn)IT運(yùn)維管理體系成熟度、運(yùn)維應(yīng)急預(yù)案、系統(tǒng)承載力的重要手段。日常加強(qiáng)應(yīng)急演練,是保障突發(fā)事件下IT運(yùn)維管理相關(guān)系統(tǒng)正常運(yùn)行的重要前提。在具體演練中,要制定詳細(xì)的演練方案,明確突發(fā)事件成因、目的、具體時(shí)間、演練成員等重要事項(xiàng),針對(duì)演練過(guò)程中發(fā)現(xiàn)的問(wèn)題,進(jìn)行評(píng)估分析,完善IT運(yùn)維管理應(yīng)急體系,為應(yīng)對(duì)突發(fā)事件打下堅(jiān)實(shí)基礎(chǔ)。