データベースの問題を迅速に検出することは、日常のデータベース運用保守 (O&M) の重要な部分です。Database Autonomy Service (DAS) は、機械学習と高精度監視データを使用して 24/7 で問題を自動的に検出する異常検出機能を提供します。この機能を手動で有効にする必要はありません。ルールベースまたはしきい値ベースのアラートと比較して、この機能はデータベースの異常な変更をより迅速に検出できます。
前提条件
対象のデータベースインスタンスは、次のいずれかのタイプです。
データベース
リージョン
ApsaraDB RDS for MySQL
MyBase for MySQL
パブリッククラウド
中国 (杭州)、中国 (上海)、中国 (深圳)、中国 (河源)、中国 (広州)、中国 (青島)、中国 (北京)、中国 (張家口)、中国 (フフホト)、中国 (ウランチャブ)、中国 (南京 - ローカルリージョン - 提供終了)、中国 (福州 - ローカルリージョン - 提供終了)、中国 (成都)、鄭州、中国 (香港)、日本 (東京)、韓国 (ソウル)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、フィリピン (マニラ)、タイ (バンコク)、UAE (ドバイ)、SAU (リヤド - パートナーリージョン)、ドイツ (フランクフルト)、米国 (シリコンバレー)、米国 (バージニア)、英国 (ロンドン)
Finance Cloud
中国東 1 ファイナンス、中国東 2 ファイナンス、中国南 1 ファイナンス、中国北 2 ファイナンス (招待プレビュー)
Alibaba Gov Cloud
中国北 2 Ali Gov 1
ApsaraDB RDS for PostgreSQL
パブリッククラウド
中国 (杭州)、中国 (上海)、中国 (深圳)、中国 (河源)、中国 (広州)、中国 (青島)、中国 (北京)、中国 (張家口)、中国 (フフホト)、中国 (ウランチャブ)、中国 (成都)、中国 (香港)、日本 (東京)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、フィリピン (マニラ)、UAE (ドバイ)、ドイツ (フランクフルト)、米国 (シリコンバレー)、米国 (バージニア)、英国 (ロンドン)
Finance Cloud
中国東 1 ファイナンス、中国東 2 ファイナンス、中国南 1 ファイナンス
Alibaba Gov Cloud
中国北 2 Ali Gov 1
ApsaraDB RDS for SQL Server
パブリッククラウド
中国 (杭州)、中国 (上海)、中国 (深圳)、中国 (河源)、中国 (青島)、中国 (北京)、中国 (張家口)、中国 (フフホト)、中国 (ウランチャブ)、中国 (成都)、中国 (香港)、日本 (東京)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、UAE (ドバイ)、ドイツ (フランクフルト)、米国 (シリコンバレー)、米国 (バージニア)、英国 (ロンドン)
Finance Cloud
中国東 1 ファイナンス、中国東 2 ファイナンス、中国南 1 ファイナンス
Alibaba Gov Cloud
中国北 2 Ali Gov 1
PolarDB for MySQL Standard Edition および Enterprise Cluster Edition
パブリッククラウド
中国 (杭州)、中国 (上海)、中国 (深圳)、中国 (河源)、中国 (広州)、中国 (青島)、中国 (北京)、中国 (張家口)、中国 (フフホト)、中国 (ウランチャブ)、中国 (成都)、中国 (香港)、日本 (東京)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、フィリピン (マニラ)、ドイツ (フランクフルト)、米国 (シリコンバレー)、米国 (バージニア)、英国 (ロンドン)
Finance Cloud
中国東 1 ファイナンス、中国東 2 ファイナンス、中国南 1 ファイナンス、中国北 2 ファイナンス (招待プレビュー)
Alibaba Gov Cloud
中国北 2 Ali Gov 1
Tair (Redis OSS-compatible)
Community Edition
Tair (Enterprise Edition) メモリ最適化
パブリッククラウド
中国 (杭州)、中国 (上海)、中国 (深圳)、中国 (河源)、中国 (広州)、中国 (青島)、中国 (北京)、中国 (張家口)、中国 (フフホト)、中国 (成都)、中国 (香港)、日本 (東京)、韓国 (ソウル)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、フィリピン (マニラ)、タイ (バンコク)、UAE (ドバイ)、SAU (リヤド - パートナーリージョン)、ドイツ (フランクフルト)、米国 (シリコンバレー)、米国 (バージニア)、英国 (ロンドン)
Finance Cloud
中国東 1 ファイナンス、中国東 2 ファイナンス、中国南 1 ファイナンス、中国北 2 ファイナンス (招待プレビュー)
Alibaba Gov Cloud
中国北 2 Ali Gov 1
Tair (Enterprise Edition) 永続メモリ最適化およびディスクベース
パブリッククラウド
中国 (杭州)、中国 (上海)、中国 (深圳)、中国 (北京)、中国 (張家口)、中国 (香港)、シンガポール、ドイツ (フランクフルト)、米国 (バージニア)
Alibaba Gov Cloud
中国北 2 Ali Gov 1
対象のデータベースインスタンスが DAS に接続されており、その接続ステータスが 正常なアクセス であること。
説明データベースインスタンスの接続方法の詳細については、「Alibaba Cloud データベースインスタンスを DAS に接続する」をご参照ください。
特徴
異常検出機能は、機械学習と高精度監視データを使用して 24/7 で問題を自動的に検出します。この機能を手動で有効にする必要はありません。ルールベースまたはしきい値ベースのアラートと比較して、この機能はデータベースの異常な変更をより迅速に検出します。
項目 | 従来のソリューション | DAS 異常検出 |
メソッド | ルールベースまたはしきい値ベース。 | AI ベース。 |
監視対象オブジェクト | 主に監視メトリックに基づきます。 | 監視メトリック、SQL 文、ログ、ロック、O&M イベントなど、幅広いオブジェクト。 |
適時性 | 5 分から 1 日以上。 | ほぼリアルタイム。 |
検出方法 | 障害駆動型。 | 例外駆動型。 |
定期的検出 | なし。 | 自動検出。 |
適応性 | ビジネスの特徴に適応できません。 | ビジネスの特徴に適応します。 |
予測 | なし。 | 予測が可能です。 |
異常検出結果の表示
DAS 自律センターでは、選択した時間範囲内に検出された異常イベントを表示できます。
DAS コンソールにログインします。
左側のナビゲーションウィンドウで、[オペレーションセンター] > [インスタンスモニタリング] をクリックします。
対象のインスタンスを見つけ、インスタンス ID をクリックして、インスタンス詳細ページに移動します。
左側のナビゲーションウィンドウで、自律型センター をクリックします。
時間範囲を選択して、その期間に発生した異常イベントを表示します。
イベント サブスクリプションの有効化
イベント サブスクリプション 機能を有効にすると、異常イベントが検出されたときに、DAS はショートメッセージなどの通知を送信します。これにより、データベースの異常な変更を迅速に発見できます。詳細については、「イベントサブスクリプション機能を有効にする」をご参照ください。
異常イベントのアラートレベルは警告です。要件に基づいてイベント通知のアラートレベルを設定できます。
よくある質問
[メトリックの異常検出 (時系列異常検出)] イベントの [異常スナップショット] の [異常メトリックの分析] セクションで、関連メトリックの変化倍率はどのように計算されますか。
変化倍率 = 実際の値 / 予測値。DAS は、以前の期間の 1 時間ごとのデータを使用して、インスタンスの現在のメトリック値を予測します。この予測値はベースラインとして機能し、現在の実際の値と比較されて変化倍率が計算されます。
新しく作成されたインスタンスやノードのトラフィックが安定しているにもかかわらず、なぜ大量の [監視メトリックの時系列異常検出] イベントがトリガーされるのですか。
DAS の異常検出機能は、まずインスタンスの既存データに基づいて予測モデルを構築し、そのモデルを検出に使用します。新しいインスタンスやノードの場合、既存のパフォーマンスデータの量が比較的少ないです。そのため、このデータから構築された予測モデルもベースラインが低くなります。ビジネス運用が開始されると、メトリックが一定期間、予測値と大幅に異なる場合があり、これが誤った急増を引き起こします。これにより、異常検出イベントが頻繁にトリガーされる可能性があります。
説明一定期間のデータ蓄積後、DAS はより正確な予測モデルを自動的に再構築し、誤ったスパイクによる [メトリック時系列異常検出] イベントは発生しなくなります。
インスタンスのパフォーマンスメトリックが数秒間、明らかな異常を示したにもかかわらず、[監視メトリック時系列異常検出] イベントがトリガーされなかったのはなぜですか。
DAS の異常検出機能は、1 分間隔で平均化されたデータを分析します。このプロセスにより、短時間の異常が平滑化され、データへの影響が最小限に抑えられます。その結果、これらの異常は検出されずに、[監視メトリック異常検出 (時系列異常検出)] イベントをトリガーしない場合があります。
関連ドキュメント
DAS の自律機能を使用して、データベースの異常が発生したときに自動的に解決できます。