云鷹平臺是光大科技打造的面向云原生的全鏈路可觀察性平臺。支持數據中心可視化、拓撲動態發現、調用鏈路與物聯網追蹤、監控日志系統對接等功能;提供全鏈路可視化、指標分析、異常告警、全鏈路壓測、輕量混沌工程、時光機等服務。平臺旨在為開發運維人員全面掌握系統的工作原理、快速發現與分析業務應用的故障與性能瓶頸,提升開發效率和服務穩定性提供強大助力。
關聯多種監控數據并深度融合告警、指標、日志和追蹤服務,基于可觀察性理念,提供從告警到鏈路追蹤層層深入的完整故障排查工作流,步步引導直達問題核心,全面提升監控體驗與問題處理效率。
基于代理與網絡探針實現的鏈路追蹤服務。可以為各個平臺各種開發語言的應用與數據庫、MQ、NoSQL等服務提供無侵入的鏈路追蹤服務。提高分布式應用、微服務體系中問題定位和架構性能優化的效率。
基于鏈路信息與指標數據動態發現并自動完成服務調用的可視化拓撲。以用戶友好的方式精確及時地展示服務調用關系和關鍵請求數據。
支持界面展示信息的高度可定制化。可以根據具體需求突出展示重點關注目標、或忽視一些不重要不關心的數據。不同的數據也可以通過方法的面板靈活選擇不同的呈現形式。
支持對接并聚合指標、日志、追蹤等多種監控數據。主流數據系統均提供對接支持,最大化兼容現有監控架構。通過對多維度數據的聚合分析快速定位問題,進一步提升排查效率。
開發者可以通過GraphQL、RESTAPI獲取云鷹平臺中鏈路數據,并將其集成在監控告警系統、大數據分析、彈性伸縮等場景中。
通過自定義追蹤指標,可以對實例中的各類指標進行收集,如鏈路延遲、JVM堆大小、實例GC次數、數據庫慢查詢等;也可以為不同的指標設置不同的預處理方式,如收集一定時間內某參數的百分位數等。更好地幫助開發者定位問題所在。
對于常見場景提供了相應的數據探針插件,同時提供基于各類語言開發的SDK工具,可以為各種場景開發定制合適的日志指標與追蹤數據上報方式。
平臺支持多租戶和RBAC等多種安全特性。在面板配置,數據源等多個維度提供高可定制化的數據隔離和訪問控制策略,通過靈活的授權認證機制避免數據泄露,確保信息安全。
以可視化方式為指標度量自由設置告警閾值,閾值被突破后將自動觸發告警,告警可發送到諸如郵箱、企業微信、釘釘等多種內置通知器或者其他告警平臺。
支持對接豐富的外部系統,如物聯網、數據中心CMDB、網絡監測系統、CI/CD流水線、IaaS平臺、PaaS平臺、統一日志與監控系統等,持續收集各系統特定數據并進行實時追蹤與展示,幫助開發和運維人員更加清晰直觀地了解系統信息,全面掌控系統整體狀態。
云鷹平臺提供了強大的數據采集能力與優秀的可視化界面。在進行全鏈路壓測時可以通過云鷹平臺輕松的觀測整個系統中各個鏈路的響應時間,各個實例、端點、服務的壓力變化。而云鷹平臺本身帶來的性能損耗非常的小,可以讓開發者得到盡可能接近實際場景的測試結果,進而更加精確的進行容量評估。
通過時刻動態生成的網絡拓撲,開發者可以觀察到系統中各個應用之間依賴關系。而在進行混沌工程實踐的情況下,開發者可以輕松的發現導致應用不可用的因素都包括哪些位置。從而能夠針對性的修復并提高系統在故障環境下的穩定性。
通過云鷹平臺,可以精準的發現微服務調用拓撲關閉和潛在架構的風險,為運維人員和架構師提供可靠的輔助信息,以便于快速修復問題和架構性能優化。結合日志可以做到業務關聯的追蹤可視化,幫助運營人員在特定場景下做到更明確的調整和優化。
通過云鷹平臺,開發者可以追蹤到一個應用從編譯到上線的每一個過程。及時的確認問題所在環節,并快速的為其做出響應。對于開發語言多,機器多,實例多的云原生應用來說,云鷹平臺提供了一個統一的、穩定的、快速的監控平臺。為云應用提供全方面不間斷的采集監控能力。