すべてのプロダクト
Search
ドキュメントセンター

Simple Log Service:フィールド分析

最終更新日:Aug 23, 2024

フィールド分析機能がサポートされています。 この機能は、テキスト、ロング、またはダブルタイプのフィールドの統計分析に使用できます。 この機能は、各フィールドの基本的な分布と関連するメトリックを分析し、各フィールドの上位5つの値の時系列チャートを提供します。 分析結果は、データのインサイトと視覚化に使用できます。

前提条件

分析するフィールドに対して、インデックス作成機能と統計機能が有効になります。 詳細については、「インデックスの作成」をご参照ください。

たとえば、ログエントリにrequest_methodフィールドとrequest_timeフィールドが含まれている場合、2つのフィールドのインデックスを設定できます。 次の図は、設定を示しています。指定字段查询

制限事項

フィールド分析のデータ範囲は、クエリページの時間範囲内にクエリ条件を満たすすべてのログです。 ログエントリの数が0.1億未満の場合、すべてのログエントリが分析されます。 ログエントリの数が0.1億を超える場合、約0.1億のログエントリがサンプリングされ、分析されます。 ログエントリをサンプリングしない場合は、時間範囲を減らすか、フィルター条件を追加することを推奨します。

フィールド分析結果の表示

  1. にログインします。Simple Log Serviceコンソール.

  2. [プロジェクト] セクションで、管理するプロジェクトをクリックします。

    image

  3. 左側のナビゲーションウィンドウで、[ログストレージ] をクリックします。 Logstoreリストで、管理するLogstoreをクリックします。

    image

  4. フィールド分析結果を表示します。

フィールドの説明

テキスト型のフィールドの詳細

基本的な配布

パラメーター

説明

合計ログ

現在のクエリページで指定されている時間範囲とクエリ条件に基づくログの総数。

現在のフィールドの合計ログ

現在のクエリ条件で指定されたフィールドを含むログの総数。

欠落ログの合計

合計ログ-現在のフィールドの合計ログ

ログの割合がありません

欠落ログの合計 /ログの合計

異なる値の合計

現在のフィールドの異なる値の数。approx_distinct関数を使用して計算されます。

明確な価値の割合

異なる値の合計 /ログの合計

統計メトリック

パラメーター

説明

最大長

フィールド値の最大長。

最小長さ

フィールド値の最小の長さ。

平均長さ

フィールド値の平均の長さ。

TOP N値の時系列チャート

時間範囲内の上位5つの値が収集され、時間の経過とともに変化する値が表示されます。

TOP N値の時系列チャートの右側にあるimageアイコンをクリックして、時系列チャートをダッシュボードに追加します。 詳細については、「ダッシュボードの作成」をご参照ください。

long型またはdouble型のフィールドの詳細

基本的な配布

パラメーター

説明

合計ログ

現在のクエリページで指定されている時間範囲とクエリ条件に基づくログの総数。

現在のフィールドの合計ログ

現在のクエリ条件で指定されたフィールドを含むログの総数。

異なる値の合計

現在のフィールドの異なる値の数。approx_distinct関数を使用して計算されます。

明確な価値の割合

異なる値の合計 /ログの合計

統計メトリック

パラメーター

説明

最大値

フィールドの最大値。

最小値

フィールドの最小値。

Average

フィールドの平均値。

中央値

データを昇順に並べ替えた後の中央の位置にあるアイテム。

四分位Q1

データを昇順に並べ替えた後の25% 位置のアイテム。

四分位Q3

データを昇順に並べ替えた後の75% 位置のアイテム。

サンプル標準偏差

フィールドのサンプル標準偏差。stddev_samp関数を使用して計算されます。

人口標準偏差

フィールドの母集団標準偏差。stddev_pop関数を使用して計算されます。

尖度

データ分布の集中度を示す統計的概念。

歪度

データ分布の非対称性の程度を示す統計的概念。

数値分布ヒストグラム

分布は10個の間隔に分割され、近似ヒストグラムが生成される。

数値分布ヒストグラムの右側にあるimageアイコンをクリックして、数値分布ヒストグラムをダッシュボードに追加します。 詳細については、「ダッシュボードの作成」をご参照ください。