全部產品
Search
文件中心

Simple Log Service:頻繁模式統計函數

更新時間:Jun 30, 2024

頻繁模式統計函數可以在給定的多屬性欄位樣本中,挖掘出具有一定代表性的屬性群組合,用來歸納當前日誌。

pattern_stat

函數格式:

select pattern_stat(array[col1, col2, col3], array['col1_name', 'col2_name', 'col3_name'], array[col5, col6], array['col5_name', 'col6_name'], support_score, sample_ratio) 

參數說明如下:

參數

說明

取值

array[col1, col2, col3]

字元型資料的輸入列。

數組形式,例如:array[clientIP, sourceIP, path, logstore]。

array['col1_name', 'col2_name', 'col3_name']

字元型資料的輸入列的對應名稱。

數組形式,例如:array['clientIP', 'sourceIP', 'path', 'logstore']。

array[col5, col6]

數值型資料的輸入列。

數組形式,例如:array[Inflow, OutFlow]。

array['col5_name', 'col6_name']

數值型資料的輸入列的對應名稱。

數組形式,例如array['Inflow', 'OutFlow']。

support_score

樣本在進行模式挖掘時的支援度。

double類型,取值為(0,1]。

sample_ratio

採樣比率,預設為0.1,表示只拿10%全量集合。

double類型,取值為(0,1]。

樣本:

  • 查詢分析:

    * | select pattern_stat(array[ Category, ClientIP, ProjectName, LogStore, Method, Source, UserAgent ], array[ 'Category', 'ClientIP', 'ProjectName', 'LogStore', 'Method', 'Source', 'UserAgent' ], array[ InFlow, OutFlow ], array[ 'InFlow', 'OutFlow' ], 0.45, 0.3) limit 1000
  • 輸出結果:

顯示項目如下:

顯示項目

說明

count

當前模式所含樣本的數量。

support_score

當前模式的支援度。

pattern

模式的具體內容,按照條件查詢的形式組織。