フィールド分析機能がサポートされています。 この機能は、テキスト、ロング、またはダブルタイプのフィールドの統計分析に使用できます。 この機能は、各フィールドの基本的な分布と関連するメトリックを分析し、各フィールドの上位5つの値の時系列チャートを提供します。 分析結果は、データのインサイトと視覚化に使用できます。
前提条件
分析するフィールドに対して、インデックス作成機能と統計機能が有効になります。 詳細については、「インデックスの作成」をご参照ください。
たとえば、ログエントリにrequest_methodフィールドとrequest_timeフィールドが含まれている場合、2つのフィールドのインデックスを設定できます。 次の図は、設定を示しています。
制限事項
フィールド分析のデータ範囲は、クエリページの時間範囲内にクエリ条件を満たすすべてのログです。 ログエントリの数が0.1億未満の場合、すべてのログエントリが分析されます。 ログエントリの数が0.1億を超える場合、約0.1億のログエントリがサンプリングされ、分析されます。 ログエントリをサンプリングしない場合は、時間範囲を減らすか、フィルター条件を追加することを推奨します。
フィールド分析結果の表示
にログインします。Simple Log Serviceコンソール.
[プロジェクト] セクションで、管理するプロジェクトをクリックします。
左側のナビゲーションウィンドウで、[ログストレージ] をクリックします。 Logstoreリストで、管理するLogstoreをクリックします。
フィールド分析結果を表示します。
1つのフィールドの分析結果を表示します。
[生ログ] タブの [インデックスフィールド] セクションで、フィールドのアイコンをクリックして、フィールドの分析結果を表示します。
フィールドの説明
テキスト型のフィールドの詳細
基本的な配布
パラメーター | 説明 |
合計ログ | 現在のクエリページで指定されている時間範囲とクエリ条件に基づくログの総数。 |
現在のフィールドの合計ログ | 現在のクエリ条件で指定されたフィールドを含むログの総数。 |
欠落ログの合計 | 合計ログ-現在のフィールドの合計ログ |
ログの割合がありません | 欠落ログの合計 /ログの合計 |
異なる値の合計 | 現在のフィールドの異なる値の数。approx_distinct関数を使用して計算されます。 |
明確な価値の割合 | 異なる値の合計 /ログの合計 |
統計メトリック
パラメーター | 説明 |
最大長 | フィールド値の最大長。 |
最小長さ | フィールド値の最小の長さ。 |
平均長さ | フィールド値の平均の長さ。 |
TOP N値の時系列チャート
時間範囲内の上位5つの値が収集され、時間の経過とともに変化する値が表示されます。
TOP N値の時系列チャートの右側にあるアイコンをクリックして、時系列チャートをダッシュボードに追加します。 詳細については、「ダッシュボードの作成」をご参照ください。
long型またはdouble型のフィールドの詳細
基本的な配布
パラメーター | 説明 |
合計ログ | 現在のクエリページで指定されている時間範囲とクエリ条件に基づくログの総数。 |
現在のフィールドの合計ログ | 現在のクエリ条件で指定されたフィールドを含むログの総数。 |
異なる値の合計 | 現在のフィールドの異なる値の数。approx_distinct関数を使用して計算されます。 |
明確な価値の割合 | 異なる値の合計 /ログの合計 |
統計メトリック
パラメーター | 説明 |
最大値 | フィールドの最大値。 |
最小値 | フィールドの最小値。 |
Average | フィールドの平均値。 |
中央値 | データを昇順に並べ替えた後の中央の位置にあるアイテム。 |
四分位Q1 | データを昇順に並べ替えた後の25% 位置のアイテム。 |
四分位Q3 | データを昇順に並べ替えた後の75% 位置のアイテム。 |
サンプル標準偏差 | フィールドのサンプル標準偏差。stddev_samp関数を使用して計算されます。 |
人口標準偏差 | フィールドの母集団標準偏差。stddev_pop関数を使用して計算されます。 |
尖度 | データ分布の集中度を示す統計的概念。 |
歪度 | データ分布の非対称性の程度を示す統計的概念。 |
数値分布ヒストグラム
分布は10個の間隔に分割され、近似ヒストグラムが生成される。
数値分布ヒストグラムの右側にあるアイコンをクリックして、数値分布ヒストグラムをダッシュボードに追加します。 詳細については、「ダッシュボードの作成」をご参照ください。