SLS(Simple Log Service)具備欄位分析功能,專註於對text、long和double類型欄位的統計分析。此功能涵蓋了欄位的基本分布情況、各種統計指標以及TOP5的時間順序圖表,為使用者提供了深入的資料洞察和視覺化檢視,便於理解和挖掘。
前提條件
已開啟對應欄位的索引和統計功能。具體操作,請參見建立索引。
例如,訪問日誌中存在request_method和request_time欄位,可參考如下配置。
使用限制
欄位分析的資料範圍,是當前查詢頁面的(滿足時間範圍和查詢條件)的全部日誌。當日誌數目在1億條以下時,會進行全量分析。當日誌數目超過了1億條,會進行採樣分析(採樣規則是將採樣後的資料控制在1億條左右),如果要避免這種採樣,建議您可以縮小時間範圍或者增加過濾條件。
查看欄位分析
在Project列表地區,單擊目標Project。
在控制台左側,單擊日誌儲存,在日誌庫列表中單擊目標Logstore。
查看欄位分析。
查看單個欄位的分析。
在原始日誌頁簽的索引欄位地區,單擊目標欄位的,可以查看目標的分析情況。
欄位說明
text欄位詳情
基本分布情況
參數 | 說明 |
日誌總行數 | 當前查詢版面設定時間和查詢條件後統計出來的資料總行數。 |
當前列總行數 | 當前查詢條件中包含該欄位所在的行統計出來的總行數。 |
缺失值總行數 | 日誌總行數 - 當前列總行數。 |
缺失值佔比 | 缺失值總行數/日誌總行數。 |
Distinct值總數 | 使用approx_distinctFunction Compute該列中不重複的欄位值數量。 |
Distinct值佔比 | Distinct值總數/日誌總行數。 |
統計指標
參數 | 說明 |
最大長度 | 該欄位值所佔的最大字元長度。 |
最小長度 | 該欄位值所佔的最小字元長度。 |
平均長度 | 該欄位值的平均字元長度。 |
Top5取值時序圖
先計算出時間範圍內總數前5的取值,然後繪製這些值隨時間的變化趨勢。
單擊Top5取值時序圖最右側的,可以將該時序圖添加到儀錶盤。建立儀錶盤請參見建立儀錶盤。
long、double欄位詳情
基本分布情況
參數 | 說明 |
日誌總行數 | 當前查詢版面設定時間和查詢條件後統計出來的資料總行數。 |
當前列總行數 | 當前查詢條件中包含該欄位所在的行統計出來的總行數。 |
Distinct值總數 | 使用approx_distinct函數計算該列中不重複的欄位值數量。 |
Distinct值佔比 | Distinct值總數/日誌總行數 |
統計指標
參數 | 說明 |
最大值 | 該欄位的最大值。 |
最小值 | 該欄位的最小值。 |
平均值 | 該欄位的平均值。 |
中位元 | 將資料正序排列後,返回位於中間位置的資料。 |
四分位元Q1 | 將資料正序排列後,返回位於25%位置的資料。 |
四分位元Q3 | 將資料正序排列後,返回位於75%位置的資料。 |
樣本標準差 | 使用stddev_samp函數計算該欄位的樣本標準差。 |
總體標準差 | 使用stddev_pop函數計算該欄位的總體標準差。 |
峰度 | 統計學概念,表示資料分布的集中程度。 |
偏度 | 統計學概念,表示資料的傾斜程度。 |
數值分布長條圖
將數值分布劃分為10個區間,統計其的近似長條圖。
單擊數值分布長條圖最右側的,可以將該數值分布長條圖添加到儀錶盤。建立儀錶盤請參見建立儀錶盤。