發布時間: 2021-07-19 09:17:15
端到端監控的目標是為在OCI上運行的業務提供服務級別和關鍵性能目標監控。隨著組織將工作負載轉移到OCI,他們需要能夠確定服務級別是否與本地環境保持一致或有所改進。
此外,如果這些OCI工作負載與其他部署(本地或其他云)集成,則它們需要跨混合和多云資產的可見性。在所有情況下,當出現性能問題時,他們都需要了解其業務交易,以了解根本原因源自何處,以便他們能夠快速修復問題并確保積極的最終用戶體驗。
統一了解應用程序的執行情況并在潛在問題影響客戶之前發現它們對業務至關重要。監控不僅限于性能指標或主機錯誤日志,還可以跨越各種數據源,例如來自OCI的審計日志、應用程序和堆棧組件遙測、用戶行為和單個應用程序和/或來自OCI的使用數據,詳細說明使用了哪些資源以及使用了多少。
對于OCI上的工作負載,這涵蓋了我們可以提供的所有監控,從客戶端的瀏覽器一直到OCI的各個組件。提供了在所有層的性能和運行狀況的統一視圖。如果發現問題,將專門構建的機器學習應用于大量指標和日志,使用戶能夠快速深入了解細節并更好地了解根本原因和補救步驟。
除了監控,我們還提供主動幫助客戶識別和避免潛在問題的功能。這是通過將異常檢測算法應用于指標或日志數據、預測資源使用情況和安排健康檢查來探測解決方案的關鍵部分來實現的。警報可以根據各種條件和閾值觸發,并可用于提醒人們或觸發自動修復任務。
今天的應用程序和解決方案可以由許多使用不同技術的組件組成,或者駐留在不同的公共云、客戶云或本地環境中。
OCI提供開箱即用和附加服務的組合供客戶根據自身的需求進行選擇,為客戶提供他們所需的端到端監控,以確保他們的工作負載以最佳方式運行。目前,OCI上面提供了下面這些開箱即用的監控服務:
事件
OCI事件服務發出事件,這些事件是指示OCI資源狀態更改的結構化消息。例如:啟動實例、終止實例、創建/更新/刪除對象。通知服務可以將事件路由到適當的渠道,或將事件發送到函數中以獲取可操作的項目,例如在實例啟動時通知特定團隊。可以在此處找到發出事件的OCI服務列表。
指標
來自OCI Monitoring的指標在指標瀏覽器中開箱即用,提供了OCI控制臺中指標的全面視圖。監控服務允許定義資源指標的閾值以生成警報。警報可以進一步輸入通知服務。OCI指標還可以與第三方工具集成,這些工具與云供應商無關,例如 Grafana,一個用于監控和分析的開源平臺。
OCI提供了一個 Grafana 插件,它使OCI作為數據源可以在單個Grafana 儀表板中查看OCI資源或OKE集群使用的OCI資源的指標。下面列出了在撰寫本文時發出指標的OCI服務。
Block Storage
Compute
Database
Events
Load Balancing
Key Management
Networking
Notifications
Object Storage
Functions
Streaming
WAF (Web Application Firewall)
可以在此處
https://docs.oracle.com/en-us/iaas/Content/Monitoring/Concepts/monitoringoverview.htm
找到有關指標服務的更多信息,包括。發出指標的OCI服務的最新列表。
健康檢查
運行狀況檢查為用戶提供外部監控功能,以確定任何面向公眾的服務的可用性和性能,包括托管網站、API端點或面向外部的負載平衡器。
日志
在OCI資源上進行API操作的審計日志事件在OCI審計控制臺中可用,并且可以通過命令行界面 (CLI) 或通過REST API導出,以供其他第三方工具使用,例如Splunk以獲取單一控制板視圖(Single Pane of Glass View)。
附加服務
雖然開箱即用的服務是免費提供的,但客戶可以選擇附加服務來使用數據并提供分析和進一步的洞察。

附加服務目前是日志分析服務、應用程序性能監控服務 (APM)。
這些服務可以收集和攝取不同類型的指標和日志,日志和指標數據可以通過三種方式提供:通過本機OCI資源自動發出數據、通過客戶可以部署的預打包代理或通過使用行業標準接口(如 REST API)。
簡單的端到端用例
下圖顯示了一個簡單的2層架構,包含以下組件:
在OCI上運行Oracle數據庫的數據庫層
2 個應用層托管WebLogic應用服務器以及在OCI上運行的Web服務器前端
前端Web服務器的OCI負載均衡器。
所有這些組件都在單獨的子網中運行,LBR子網是唯一的公共子網。

該圖顯示了以淺藍色突出顯示的3個不同的監控組件:
云代理:在操作系統中運行,從操作系統和其他應用程序(如 Web 服務器、數據庫等)收集指標和日志。云代理還可以收集通過syslog 流式傳輸的日志,并且可以從其他數據收集機制(例如 Collectd、Telegraf、 Mircosoft SCOM 和 VMWare VCenter Ops。
APM 代理:在應用服務器內運行,主要是對其進行檢測并提供有關在應用服務器上運行的應用程序執行的詳細信息
APM 瀏覽器代理:在客戶端瀏覽器中查看的網頁中嵌入 JavaScript,以檢測設備級別的最終用戶性能。Java Script在網頁加載時執行,并將信息發送回應用程序性能監控服務。
除了上面提到的三個組件之外,OCI 還自動為許多本機資源提供指標。例如。您不能在塊存儲卷或 VCN 上安裝代理,但這些資源會自行發出預定義的指標。
下表列出了可以收集和用于監控上述解決方案的所有不同類型的指標和日志:

Log Analytics Service
Log Analytics Service 用于日志事件攝取、分析、字段豐富和索引。可以從多個來源安全地攝取日志數據。通過了解預定義實體類型形式的日志結構和內容以及開箱即用的日志源,從基礎設施和應用程序收集的日志有助于關聯活動、解決問題并提供可操作的見解。目前以下是通過 Log Analytics 攝取日志的三種方法
云代理
可以持續收集注冊實體的日志文件。日志源需要與實體類型相關聯,以便云代理知道它應該收集什么。通常代理安裝在產生日志的服務器上。
按需上傳客戶端ODU
對于臨時或按需場景,可以使用 ODU(On-Demand Upload)客戶端。ODU 客戶端是一種命令行工具,可用于在一次操作中攝取多個文件。
RestAPI(需要服務請求才能啟用)
REST API 是開發人員/DevOps 團隊可以用來編排日志攝取的另一個選項。
在加載和豐富的數據上,可能的操作是對日志進行分析和探索(搜索),關聯和獲取關鍵值并獲得對數據的操作洞察。
交互式數據可視化是關鍵,它提供了各種選項,例如通過餅圖、條形圖和直方圖等圖形將數據與一個或多個參數進行比較和對比。這有助于匯總數據并在需要的地方深入挖掘數據集。
對于高級分析,日志分析服務使用機器學習來識別來自不同數據集的模式并將它們分組到聚集中。通過對來自不同數據集的模式進行聚類,異常值或突出的模式就是結果。相反,如果用例/高級分析需要從不同的數據集中挑選特定的日志記錄并將它們分組以進行進一步分析,那么“鏈接”功能提供了這樣的功能。
聚集上的鏈接是一個混合用例,讓日志分析服務在模式上聚集并使用鏈接對日志記錄進行分組以進行其他模式/分析。
應用性能監控服務
Oracle Application Performance Monitoring 是一項云服務,可提供對客戶Web應用程序性能的深入可見性。使用Oracle應用程序性能監控,您可以:
快速隔離應用程序性能問題
深入到問題上下文中的相關日志并找到其根本原因
獲得對所有層級應用程序性能的端到端可見性
監控最終用戶體驗
Web應用程序的監控是通過使用APM Java 代理實現的,APM Java 代理是一個輕量級代理,它在Web應用程序的Java 虛擬機 (JVM) 中運行,并為在您的數據中心或云中運行的 Java Web應用程序收集性能監控數據。
使用 Oracle APM,您可以通過跟蹤跨服務器的事務來確定導致應用程序問題的確切層,查看該問題是否特定于某個地理區域,并在應用程序性能的上下文中自動查看應用程序日志,從而監控應用程序的性能.當我們擁有來自全球分布式測試代理的數據以及來自應用程序內部的數據時,確定問題是出在應用程序上還是區域網絡問題變得更加容易。
綜合監控(Synthetic Monitoring)有助于模擬應用程序中用戶通常會采用的路徑,并確保用戶可以順利過渡到路徑中的不同網頁。這有助于在最終用戶體驗之前識別應用程序性能問題。綜合監控允許執行以下類型的測試:
HTTP Ping —測試應用程序的連接性和性能
頁面加載——測試單個 URL 的性能,由瀏覽器加載
腳本操作 - 測試使用 Selenium 腳本記錄的完整工作流的性能。
Rest Web 服務— 測試使用 REST Web 服務的完整工作流的性能。
APM通過監控最終用戶體驗、服務器請求、應用程序服務器和其他實體來監控應用程序性能。最終用戶體驗監控是通過密切關注應用程序的各個方面來完成的,包括頁面性能、AJAX 請求監控和應用程序請求性能監控。
上一篇: rhca未來前景怎么樣
下一篇: 制造型企業為什么要數字化轉型