このトピックでは、データ変換ジョブのメトリックと、データ変換ダッシュボードを表示してジョブモニタリングを構成する方法について説明します。
メトリックデータ
データ変換ジョブのメトリックデータを表示するには、まずサービスログ機能を有効にし、ログタイプとしてジョブ操作ログを選択する必要があります。 詳細については、「サービスログ機能の使用」をご参照ください。
ダッシュボード
データ変換ジョブを作成すると、Simple Log Serviceはジョブの詳細ページにジョブのダッシュボードを作成します。 ダッシュボードでジョブのメトリックを表示できます。
手順
[プロジェクト] セクションで、管理するプロジェクトをクリックします。
左側のナビゲーションウィンドウで、
を選択します。管理するデータ変換ジョブをクリックします。 次に、[実行ステータス] セクションのダッシュボードを表示します。
全体的なメトリックス
全体的なメトリックは次のとおりです。
Transforming Speed (events/s): 1秒あたりのイベント単位の変換速度。 デフォルトの統計ウィンドウは1時間です。
ingest: ソースLogstoreの各シャードから読み取られたデータレコードの数。
delivery: 宛先Logstoreに正常に書き込まれたデータレコードの数。
failed: ソースLogstoreの各シャードから読み取られたが変換に失敗したデータレコードの数。
合計イベントの読み取り数: ソースLogstoreの各シャードから読み取られたデータレコードの合計数。 デフォルトの統計ウィンドウは1日です。
配信されたイベントの合計: すべての宛先ログストアに書き込まれたデータレコードの合計数。 デフォルトの統計ウィンドウは1日です。
失敗したイベントの合計: ソースの各シャードから読み取られたが変換に失敗したデータレコードの合計数。 デフォルトの統計ウィンドウは1日です。
イベント配信比率: ソースLogstoreから読み取られたデータレコードの数に対する、ターゲットLogstoreに正常に配信されたデータレコードの数の比率。 デフォルトの統計ウィンドウは1日です。
シャード詳細分析
このセクションでは、変換ジョブがソースLogstoreからデータを読み取るときに、各シャードのメトリックを1分ごとに表示します。
Shard Consuming Latency (s): 各シャードに書き込まれた最後のデータレコードが受信された時刻と、シャードによって処理されているデータレコードが受信された時刻との差。 単位は秒です。
Shard Transforming Stats (events): アクティブなシャードに関する統計。 デフォルトの統計ウィンドウは1時間です。
shard: シャードのシーケンス番号。
ingest: シャードから読み取られた生データレコードの数。
failed: シャードから読み取られたが変換に失敗した生データレコードの数。
変換エラー
メッセージフィールドに基づいて、エラーの詳細を表示できます。
アラートモニタリングルール
データ変換 (新バージョン) ジョブは、監視対象のタスクメトリックに依存しています。 詳細については、「メトリックデータ」をご参照ください。 Simple Log Serviceのアラート機能を使用して、ジョブを監視できます。 詳細については、「アラート」をご参照ください。 このセクションでは、データ変換 (新バージョン) ジョブのアラートルールについて説明します。シャード消費レイテンシ、データ変換例外、変換トラフィック (絶対値) 、変換トラフィック (同期間比較) です。 アラートルールの作成方法の詳細については、「アラートルールの作成」をご参照ください。
アラートルールを作成するには、統計的な目的で、プロジェクトの実行ログに保存されているものと同じプロジェクトとLogstoreを追加する必要があります。 ジョブの操作ログを保存する方法の詳細については、「サービスログ機能の使用」をご参照ください。
シャード消費レイテンシ
項目 | 説明 |
目的 | このタイプのルールは、データ変換ジョブのシャードからデータが消費されるときに発生するレイテンシを監視します。 データ変換中のレイテンシがルールのしきい値を超えると、アラートがトリガーされます。 |
関連ダッシュボード | 詳細については、「シャードの詳細分析」をご参照ください。 |
サンプルSQL | 次のテンプレートで、
|
監視ルール |
説明 これらの設定に基づいてルールを構成し、1分間のウィンドウに基づいてメトリックが更新および処理されないようにし、データのスパイクに起因する待ち時間によって引き起こされる誤ったアラートを防ぐことをお勧めします。 |
処理方法 | 次のルールに基づいて、トリガーされたアラートをクリアできます。
|
データ変換例外
項目 | 説明 |
目的 | このタイプのルールは、データ変換ジョブの例外を監視します。 データ変換中に例外が発生すると、アラートがトリガーされます。 |
関連ダッシュボード | 詳細については、「変換エラー」をご参照ください。 |
サンプルSQL | 次のテンプレートで、
|
監視ルール |
|
取り扱い方法 | エラーメッセージに基づいて例外を修正します。
|
イベント配信比率 (同期比較)
項目 | 説明 |
目的 | このタイプのルールは、ターゲットLogstoreに書き込まれたデータレコードの比率と、前日または週の同じ期間のデータレコードの比率との比較を監視します。 値が指定された増加のしきい値を超えるか、指定されたしきい値を下回ると、アラートがトリガーされます。 |
関連ダッシュボード | イベント配信比率: ソースLogstoreから読み取られたデータレコードの数に対する、ターゲットLogstoreに正常に配信されたデータレコードの数の比率。 デフォルトの統計ウィンドウは1日です。 |
サンプルSQL | アラートルールを作成するためのダイアログボックスで、クエリ用に次のSQL文を入力します。 次のテンプレートで、
|
監視ルール |
説明 毎日または毎週の比較にしきい値を20% 以上に設定するか、生のトラフィックサイクルに合わせて比較サイクルを調整することを推奨します。 これは、生データトラフィックの定期的な変動によって引き起こされる誤ったアラートを防ぐのに役立ちます。 |
取り扱い方法 | 次のルールに基づいて、トリガーされたアラートをクリアできます。
|
イベント読み取り率 (同期間比較)
項目 | 説明 |
目的 | このタイプのルールは、ソースLogstoreから読み取られたデータレコードの比率と、前日または週の同じ期間のデータレコードの比率との比較を監視します。 値が指定された増加のしきい値を超えるか、指定されたしきい値を下回ると、アラートがトリガーされます。 |
関連ダッシュボード | 合計イベントの読み取り数: ソースLogstoreの各シャードから読み取られたデータレコードの合計数。 デフォルトの統計ウィンドウは1日です。 |
サンプルSQL | アラートルールを作成するためのダイアログボックスで、クエリ用に次のSQL文を入力します。 次のテンプレートで、
|
監視ルール |
説明 毎日または毎週の比較にしきい値を20% 以上に設定するか、生のトラフィックサイクルに合わせて比較サイクルを調整することを推奨します。 これは、生データトラフィックの定期的な変動によって引き起こされる誤ったアラートを防ぐのに役立ちます。 |
取り扱い方法 | 次のルールに基づいて、トリガーされたアラートをクリアできます。
|
配信されたイベント (同期比較)
項目 | 説明 |
目的 | このタイプのルールは、ターゲットLogstoreに書き込まれたデータレコードの数と、前日または週と同じ期間のデータレコードの数との比較を監視します。 値が指定された増加のしきい値を超えるか、指定されたしきい値を下回ると、アラートがトリガーされます。 |
関連ダッシュボード | ダッシュボード > 全体的なメトリクス > 配信されたイベントの合計 |
サンプルSQL | アラートルールを作成するためのダイアログボックスで、クエリ用に次のSQL文を入力します。 次のテンプレートで、
|
監視ルール |
説明 毎日または毎週の比較にしきい値を20% 以上に設定するか、生のトラフィックサイクルに合わせて比較サイクルを調整することを推奨します。 これは、生データトラフィックの定期的な変動によって引き起こされる誤ったアラートを防ぐのに役立ちます。 |
取り扱い方法 | 次のルールに基づいて、トリガーされたアラートをクリアできます。
|