IT運維管理到底是什么呢?
是網管?
是監控?
是工具?
是設備管理?
沒有這么簡單。因為今天,無論是信息架構還是IT部門的職責和定位都已經發生了轉變。DT時代(數據科技時代)下,傳統IT架構已然滿足不了面對復雜的業務場景的每分鐘數萬個數據采集所需。在該形勢下,兼顧應用層、網絡層、感知層等橫向又致力于解決IT系統縱向架構中的RIIL(Real-time Intelligence Infrastructure Library)呼之欲出。
與傳統的IT運維產品相比,RIIL到底有什么不同呢?
RIIL就是統一管理信息化的人、財、物,把這些人、財、物信息收集以后,整合為基于業務、面向管理者、高度可視化的運營管理平臺。該運維管理平臺將IT基礎架構及相關應用有效量化,并映射到它們支持的業務上,直觀反映IT基礎設施的動態變化對業務造成的影響和威脅,幫助管理者實現IT的精細化管理,掌控全局,準確衡量IT對業務的價值貢獻,有力保障業務的健康、穩定運行
從運維到運營--抬頭看用戶,低頭看自己,向前看趨勢
RIIL幫助客戶構建完整IT管理體系
平臺功能價值
1. 統一資源管理,全面、動態掌握資源變化
RIIL提供多維資源管理視圖,對不同品牌、類型、版本的網絡設備、安全設備、無線設備、存儲、主機、中間件、數據庫、虛擬化、應用服務、視頻監控、統一通信設備的等IT資源進行統一、全方位、多層次的綜合管理,實時分析資源當前性能和運行狀態,直觀反映資源的動態變化對支撐業務的影響,與CMDB相結合,完整掌握資源的管理屬性。通過對資源的歷史事件分析,了解其穩定性及衰減趨勢,為投資決策提供依據。
2. 告警管理
RIIL通過TOPN、趨勢分析報表幫助IT管理者及早發現IT基礎架構的缺陷和隱患;通過自動巡檢功能做到主動預防,采用自動化手段針對核心業務系統及關鍵指標進行例行檢查,可以巡檢的內容包含有網絡設備、服務器、中間件、數據庫、動環環境等定時產生巡檢報告推送給管理者加以分析;事件臺能夠智能感知異常,快速定位發生源,識別異常的嚴重程度并加以過濾,及時、準確地發出告警;結合RIIL服務請求管理中心,實現整個事件處理過程的可視化,保持良好的服務水平;RIIL還提供知識管理功能,形成事件維護記錄的自然積累,IT人員可利用知識快速解決當前事件,極大提高事件的解決效率,自動巡檢能幫助運維人員將日常需要人工定期巡檢的例行工作交由系統自動完成。
3. 統一門戶管理
支持統一WEB門戶,支持自定義多種首頁面;支持內置6種以上布局模板;支持自定義每個頁面的展示內容和窗體標題,支持拖拽方式布局每個窗體的大小和位置。
4. 無線管理
多廠商,有線、無線一體化管理。支持對銳捷、H3C、華為、Cisco、Aruba、Juniper無線設備的的全方位管理。圖形化展現無線設備及用戶分布情況,用戶體驗好壞直觀可視。
5. 分級管理
打破行政界線,貫通縱向業務
支持最多三級分級管理,可實現從總部到省,再到地市的三級統合管理。
幫助管理者打破行政界線、從業務角度理清分布在各地的IT業務資源,實現級數據統合。
6. 端到端管理
智能追蹤,快速定位故障
支持查詢功能,可靈活設置起始端用戶和終點應用端,通過對配線、位置、設備、鏈路、流量、用戶的智能匹配,將問題處理從繁瑣的反復詢問+人工梳理的方式,轉變為智能化的路徑追蹤+遠程處理,從而縮短故障問題處理的時間及效率。
7. 云基礎架構管理
簡化云運維,提升管理效率
虛擬化:VMware、Hyper-V、Citrix、H3C、華為、KVM等主流廠商支持,復雜結構關系清晰可視、幾百種指標深度整合。存儲:IBM、Brocade、EMC、NetAPP、浪潮、HP、Nexsan、華為、3PAR、Dell、宏杉等主流存儲廠商支持,實現對存儲 設備、光纖通道、存儲池、卷、磁盤、主機的全面管理。
RIIL的架構設計
-
數據采集層
本層由各種協議適配器構成,向上層提供統一的接口訪問管理協議棧(SNMP/CMIP/TL1等),獲取管理信息(包括事件信息、日志信息、性能信息和拓撲信息等),并在初始發現時作為驅動模塊構建信息模型。采集層通過AgentLess方式、腳本或和其他產品整合的方式來獲取數據。
DCS(Data Collector server數據采集服務):負責各資源的指標采集,可配置多個DCS滿足大規模采集,實現高可用性。
LOG(Log Server 日志服務):完成日志的收集采集工作。
NFA(NFA Server 流量分析服務):支持主流流量分析協議,實現流量分析的功能。
DIS(Discovery Server 發現服務):用于配置自動發現及添加服務器??膳渲冒l現策略,用于拓撲、資源的發現與添加。
-
數據匯聚層
對底層數據采集的數據進行統一的描述,組織為管理信息庫。向上提供一個統一的管理語義和調用接口。使得各個業務模塊面對統一的數據模型,使得對資源的管理方式一致并處于單一的可控路徑下,方便對資源進行權限管理,互斥訪問等操作,使得面向事務的并發管理成為可能。
CCS(Center Controler Server 控制中心服務):將采集數據寫入中心數據庫,同時負責邏輯處理,生成告警、策略、處理Portal中用戶輸入等。
-
數據處理層
專注于管理業務的實現,不再關心底層協議的差異性。響應前臺應用的請求,完成數據查詢,處理等功能。
DB(DB Server 數據庫服務):負責存儲數據匯聚所有采集數據,并與中心控制服務器交互。
-
數據展現層
前臺界面,將數據處理層得到數據加以顯示,是管理員與綜合業務監控系統的接口。
POS(Portal Server門戶服務):數據統一展現。展現層通過Portal以完全B/S方式來展現各個管理模塊;實現與用戶互動,響應用戶的操作與設定。
實際案例
1. 某高校應用RIIL變被動為主動,智慧運維拓展未來發展空間
通過應用RIIL系統,學校最終能夠快速地對6000余臺IT設備及各類IT資源進行統一的監控,快速定位故障位置和智能預警,為學校信息管理人員提供了高效、便捷的管理手段,并變被動為主動,實現資源的高度可視化管理。
規范化、標準化、高效的運維管理體制,同時也讓用戶能夠簡單便捷的獲取服務請求,讓管理人員能夠快捷高效地受理服務事件,并積累歷史運維數據,實現對IT資源、服務事件的運維與監控數據的統一分析,為學校未來信息化建設、運維管理優化提供數據支撐與決策分析。學校老師談到:“借助RIIL運維監控系統,不僅讓我們方便快速地掌握了網絡實時運維狀態,提升運維服務效率、降低了服務成本。更重要的是,這些運維數據為我們提供了大量的重要信息,在幫助我們快速做出適當決策的同時,也為校園網絡應用的進一步發展打下了良好的基礎。
2. RIIL--醫院信息系統的可視化監護儀與工作站
某醫院通過RIIL綜合業務管理中心的部署,實現了網絡設備、服務器、核心應用等IT資源的統一集中管理,并實現全院從出口到中心機房和集團各院之間的全局網絡及架構的監控和管理。與此同時,結合RIIL的業務視圖監控及大屏展示功能,系統將醫院的業務進行了可視化呈現,在進行實時監控的同時還可以協助現場運維人員及時定位故障原因,分析網絡抖動情況,從而提高日常運維效率。此外,RIIL綜合業務管理中心還可以將所關注的資源及指標進行詳細呈現,使醫院運維人員在不登錄設備時也能夠實時掌控其運行情況,以保障網絡及醫院核心業務的正常運行。
RIIL IT運維管理服務平臺就像醫院信息化系統的可視化監護儀與工作站,幫助醫院實現了基礎資源的集中化監管,提升了IT設備的資源利用率,并通過標準化的運維服務體系,大大縮短運維人員故障響應時間,避免人工服務產生的誤差,減少了由于業務系統異常給醫院診療服務帶來的損失。