“道生一,一生二,二生三,三生萬物”,老子用簡單的幾個字闡述了由簡至繁的過程。從簡單到復(fù)雜,這是社會發(fā)展的走向,也是萬物發(fā)展的過程。而當事物發(fā)展到一定程度之后,面對日趨復(fù)雜的環(huán)境,人們會通過從各種復(fù)雜的事物中找到簡單的規(guī)律,以期更好的認識世界的各種事物,從而去駕馭或改造客觀世界,即由繁至簡。對企業(yè)IT運維來講,亦是如此。
伴隨企業(yè)信息化進程不斷深入,企業(yè)業(yè)務(wù)對IT系統(tǒng)的依賴性越來越強,IT已經(jīng)成為很多業(yè)務(wù)流程的核心部分甚至是某些業(yè)務(wù)賴以運行的基礎(chǔ)。為了保障業(yè)務(wù)的正常運行,絕大多數(shù)企業(yè)已經(jīng)放棄傳統(tǒng)的“一刀切”的單維監(jiān)控方案,轉(zhuǎn)而投向立體分散的“全棧”監(jiān)控方法。系統(tǒng)監(jiān)控、APM、用戶行為監(jiān)測、日志分析等多種監(jiān)控工具對物理機、虛擬機、IAAS、PASS等各種IT環(huán)境監(jiān)控。而微服務(wù)、容器等技術(shù)的發(fā)展,使得底層環(huán)境又更加有利于分布式部署;同時應(yīng)用程序愈加快速的頻繁更新,讓企業(yè)IT監(jiān)控的數(shù)據(jù)量以幾何級的增加。企業(yè)IT運維由簡至繁。
由簡至繁,企業(yè)監(jiān)控陷入告警風(fēng)暴
然而,多樣的IT監(jiān)控工具相互割裂,運維工程師不斷地在各種屏幕和儀表板之間疲于奔命,同時面臨新的挑戰(zhàn):
1告警風(fēng)暴頻發(fā)
不斷增加的監(jiān)測工具與所需要處理的龐大數(shù)據(jù)相結(jié)合后,導(dǎo)致了告警激增。每當發(fā)生故障時,IT團隊都被來自多個監(jiān)控工具的警報所淹沒。導(dǎo)致不僅難以快速檢測和分類問題,而且還容易將嚴重問題掩蓋。
2I****T運維的壁壘
運維部門常會碰到以下場景:核心業(yè)務(wù)系統(tǒng)不能正常訪問,然而問題根源難以查找。各環(huán)節(jié)負責(zé)人員只針對當前自己所監(jiān)控的平臺進行排查,同時各環(huán)節(jié)數(shù)據(jù)相互割裂,不能從整體出發(fā)快速判斷業(yè)務(wù)故障節(jié)點,導(dǎo)致系統(tǒng)的恢復(fù)時間較長,造成業(yè)務(wù)受損嚴重。
3監(jiān)控數(shù)據(jù)展示缺失
當前業(yè)務(wù)對IT運維精細化要求越來越高,精細化的運維必然要求對海量運維數(shù)據(jù)的實時深入分析。然而傳統(tǒng)運維平臺當遇到事件高并發(fā)量情況時,往往會發(fā)生告警延遲甚至丟事件,性能數(shù)據(jù)查詢展現(xiàn)響應(yīng)慢或無響應(yīng)等問題。
面對多樣的監(jiān)測工具、海量的告警信息,企業(yè)需要一種工具,充分發(fā)揮監(jiān)控數(shù)據(jù)的價值,從海量告警信息中快速定位問題核心并解決故障。降低IT運維成本,讓運維人員脫離救火隊員的苦海。
優(yōu)锘EMV,讓告警由繁至簡
面對上述問題,Tarsier—EMV給出解決之道。作為集中事件處理平臺,能夠幫助運維人員更準確的識別故障,更智能的診斷故障,更高效的協(xié)作處理故障。幫助運維人員簡化海量告警,精準定位對業(yè)務(wù)造成影響的關(guān)鍵告警信息,實現(xiàn)告警信息的由繁至簡。
高效的事件整合
各專業(yè)監(jiān)控工具的獨立部署帶來了大量碎片化的數(shù)據(jù)和頻繁的工具切換,降低了故障分析和處理效率。 EMV 提供了豐富的集成適配器,能夠高效匯聚各專業(yè)監(jiān)控工具的告警事件,并將原始告警事件數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一、標準的數(shù)據(jù)模型,形成可讀性更強的全局監(jiān)控視圖,幫助運維團隊快速了解跨專業(yè)故障情況。
面向場景的事件歸集
各專業(yè)監(jiān)控工具的獨立部署帶來了大量碎片化的數(shù)據(jù)和頻繁的工具切換,降低了故障分析和處理效率。EMV提供了豐富的集成適配器,能夠高效匯聚各專業(yè)監(jiān)控工具的告警事件,并將原始告警事件數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一、標準的數(shù)據(jù)模型,形成可讀性更強的全局監(jiān)控視圖,幫助運維團隊快速了解跨專業(yè)故障情況。
面向業(yè)務(wù)的故障管理
在當今分布式、高可用IT環(huán)境中,設(shè)備告警并不一定影響業(yè)務(wù),因此傳統(tǒng)面向設(shè)備的告警管理不再適用。EMV參考業(yè)界實踐,提供了面向業(yè)務(wù)故障管理,將告警與業(yè)務(wù)進行關(guān)聯(lián),幫助IT團隊更準確的識別故障,加速故障處理效率。
自助的事件規(guī)則設(shè)定
將過去事件處理策略的“黑盒”編制方式,改為整個運維團隊都可以查看且自定義的“透明盒”。業(yè)務(wù)部門可以根據(jù)自己的業(yè)務(wù)需求定義告警策略,使得監(jiān)控平臺由封閉走向開放,由工具走向平臺。
可視化的故障分析
傳統(tǒng)的告警事件以表格形式呈現(xiàn),運維團隊難以直觀感知告警事件發(fā)生的先后順序和相互依賴關(guān)系。 EMV 提供可視化的故障診斷能力,既可通過告警時序圖,幫助運維團隊從告警發(fā)生的先后順序判斷故障根因,也可通過拓撲架構(gòu)圖,幫助運維團隊從故障組件的相互依賴關(guān)系判斷故障根因。
至繁歸于至簡,IT運維效率提速
在經(jīng)過EMV將告警信息由繁至簡的過程之后,企業(yè)IT運維人員在處理業(yè)務(wù)告警時,將實現(xiàn):
問題診斷效率提升
通過事件歸集智能地將警報分組和關(guān)聯(lián)到相關(guān)事件中,通過時序圖和視圖模式,用戶從時間和空間兩個維度更容易地發(fā)現(xiàn)關(guān)鍵問題并找出根本原因。
故障修復(fù)時間加快
通過告警歸集將獲得事件的完整關(guān)聯(lián)信息,而不僅僅是單個告警的信息。可以避免寶貴的故障處理時間的浪費,提升故障處理時效。
建立眾創(chuàng)化的運維團隊
簡單易用的事件處理規(guī)則設(shè)定,降低了規(guī)則設(shè)定的使用門檻,可以讓業(yè)務(wù)、運維、開發(fā)人員參與到規(guī)則制定的過程中,形成眾創(chuàng)化運維團隊。
互聯(lián)網(wǎng)的發(fā)展仍將繼續(xù)高速前行,而今后企業(yè)面對的IT運維將更加復(fù)雜化。面對不斷推進的業(yè)務(wù)變革,EMV將持續(xù)在事件集中處理上發(fā)力,幫助企業(yè)實現(xiàn)受損業(yè)務(wù)的快速問題查找,更好的實現(xiàn)企業(yè)產(chǎn)品及服務(wù)價值。
