Simple Log Serviceでは、Logtailを使用してホストからメトリックデータを収集できます。 メトリックデータには、CPU、メモリ、ロード、ディスク、およびネットワークデータが含まれます。 このトピックでは、Logtailを使用してホストからメトリックデータを収集する方法について説明します。
前提条件
プロジェクトとMetricstoreが作成されます。 詳細については、「プロジェクトの作成」および「Metricstoreの作成」をご参照ください。
制限事項
Windowsサーバーはサポートされていません。
GPUとハードウェアの状態に関するメトリックデータは収集できません。
ホストメトリックデータを収集できるのは、Linux Logtail V0.16.40以降のみです。 以前のバージョンのLogtailをサーバーにインストールしている場合は、サポートされているバージョンにLogtailを更新する必要があります。 詳細については、「LinuxサーバーへのLogtailのインストール」をご参照ください。
手順
[データのインポート] セクションで、[モニタリングデータ] タブをクリックします。 次に、[ホスト監視データ] をクリックします。
プロジェクトとMetricstoreを選択します。 次に、[次へ] をクリックします。
マシングループを作成します。
マシングループが利用可能な場合は、[既存のマシングループを使用] をクリックします。
使用可能なマシングループがない場合は、次の手順を実行してマシングループを作成します。 この例では、Elastic Compute Service (ECS) インスタンスが使用されています。
[ECSインスタンス] タブで、[手動でインスタンスを選択] を選択します。 次に、使用するECSインスタンスを選択し、[作成] をクリックします。
詳細については、「ECSインスタンスへのLogtailのインストール」をご参照ください。
重要Simple Log Serviceとは異なるAlibaba Cloudアカウント、データセンター内のサーバー、またはサードパーティのクラウドサービスプロバイダーのサーバーに属するECSインスタンスからログを収集する場合は、Logtailを手動でインストールする必要があります。 詳細については、「LinuxサーバーへのLogtailのインストール」をご参照ください。 Logtailを手動でインストールした後、サーバーのユーザー識別子を設定する必要があります。 詳細については、「ユーザー識別子の設定」をご参照ください。
Logtailをインストールしたら、[インストールの完了] をクリックします。
[マシングループの作成] ステップで、[名前] パラメーターを設定し、[次へ] をクリックします。
Simple Log Serviceでは、IPアドレスベースのマシングループとカスタム識別子ベースのマシングループを作成できます。 詳細については、「IPアドレスベースのマシングループの作成」および「カスタム識別子ベースのマシングループの作成」をご参照ください。
[ソースサーバーグループ] から新しいマシングループを選択し、マシングループを [応用サーバーグループ] に移動します。 [次へ] をクリックします。
重要マシングループを作成した直後にマシングループを適用すると、マシングループのハートビートステータスがFAILになる可能性があります。 この問題は、マシングループがSimple Log Serviceに接続されていないために発生します。 この問題を解決するには、[自動再試行] をクリックします。 問題が解決しない場合は、Logtailでハートビート接続が検出されない場合はどうすればよいですか?
[データソースの設定] ステップで、[設定名] および [プラグイン設定] パラメーターを設定します。 次に、[次へ] をクリックします。
入力は必須であり、Logtail構成のデータソース設定を構成するために使用されます。
重要inputパラメーターで指定できるデータソースの種類は1つだけです。
{ "inputs": [ { "detail": { "IntervalMs": 30000 }, "type": "metric_system_v2" } ] }
パラメーター
データ型
必須
説明
タイプ
String
課金されます
データソースのタイプ。 値をmetric_system_v2に設定します。
IntervalMs
int
課金されます
2つの連続するリクエストの間隔。 単位:ミリ秒。 値は5000以上である必要があります。 値を30000に設定することを推奨します。
次のステップ
クエリと分析
メトリックデータが収集されたら、Metricstoreのクエリと分析ページでデータをクエリおよび分析できます。 詳細については、「メトリックデータの照会と分析」をご参照ください。
ホストメトリックの詳細については、「メトリック」をご参照ください。
Simple Log Serviceでの可視化
Simple Log Serviceは、プロジェクトにホストモニタリングダッシュボードを自動的に作成します。 ダッシュボードでは、クエリと分析の結果の表示、アラートの設定、その他の操作を実行できます。
Grafanaでの視覚化
Simple Log Serviceは、ホストメトリックデータ用のGrafanaダッシュボードテンプレートを提供します。 Grafanaダッシュボードでクエリと分析の結果を表示できます。 詳細については、「Prometheusを使用したKubernetesメトリックデータの収集」をご参照ください。 Grafanaダッシュボードテンプレートの詳細については、「1 Simple Log Service v2020.08.08のホストメトリックモニタリング」をご参照ください。
メトリクス
次の表は、CPU、メモリ、負荷、ディスク、およびネットワークに関連するメトリックを含むメトリックについて説明しています。
CPU関連のメトリクス
メトリック
説明
単位
値の例
cpu_count
CPU コア数。
非該当
2.0
cpu_util
CPU使用率。 CPU使用率は、1からアイドルカウンタ、待機カウンタ、およびスティールカウンタの合計を引いたものに等しい。
パーセント (%)
7.68
cpu_guest_util
Linuxのゲストカウンター。 このカウンタは、CPUが通常の優先度のプロセスに費やす時間の割合を示します。
パーセント (%)
0.0
cpu_guestnice_util
Linuxのguest_niceカウンター。 このカウンタは、CPUが指定された優先度のプロセスに費やす時間の割合を示します。
パーセント (%)
0.0
cpu_irq_util
Linuxのirqカウンター。 このカウンタは、CPUがハードウェア割込み要求の処理に費やす時間の割合を示す。
パーセント (%)
0.0
cpu_nice_util
Linuxの素晴らしいカウンター。 このカウンタは、CPUが指定された優先度のユーザモードプロセスに費やす時間の割合を示す。
パーセント (%)
0.0
cpu_softirq_util
Linuxのsoftirqカウンター。 このカウンタは、CPUがソフトウェア割り込み要求の処理に費やす時間の割合を示す。
パーセント (%)
0.06
cpu_steal_util
Linuxの盗みカウンター。 このカウンターは、CPUが仮想環境で他のオペレーティングシステムを実行するのに費やす時間の割合を示します。
パーセント (%)
0.0
cpu_sys_util
Linuxのシステムカウンター。 このカウンタは、CPUがカーネルモードプロセスに費やす時間の割合を示します。
パーセント (%)
2.77
cpu_user_util
Linuxのユーザーカウンター。 このカウンタは、CPUが通常の優先度のユーザモードプロセスに費やす時間の割合を示す。
パーセント (%)
4.84
cpu_wait_util
Linuxのiowaitカウンター。 このカウンタは、未処理のディスクI/O要求が存在するときにCPUがアイドリングに費やす時間の割合を示す。
パーセント (%)
0.11
メモリ関連のメトリック
メトリック
説明
単位
値の例
mem_util
メモリ使用量。
パーセント (%)
51.03
mem_cache
割り当てられているが未使用のメモリの量。
Byte
3566386668.0
mem_free
未使用のメモリの量。
Byte
177350084.0
mem_available
使用可能なメモリの量。
Byte
3699885553.0
mem_used
使用されたメモリの量。
Byte
4041510463.0
mem_swap_util
スワップ使用率。The swap usage.
パーセント (%)
0.0
mem_total
メモリサイズ。
Byte
7919128576.0
ディスク関連のメトリクス
メトリック
説明
単位
値の例
disk_rbps
ディスクから読み取られる1秒あたりのデータ量。
Byte/s
8376.81
disk_wbps
ディスクに書き込まれる1秒あたりのデータ量。
Byte/s
247633.58
disk_riops
1秒間にディスクで完了した読み取り操作の数。
読み取り /s
0.22
disk_wiops
1秒間にディスクで完了した書き込み操作の数。
書き込み /s
43.39
disk_rlatency
平均読み取りレイテンシ。
ミリ秒
2.83
disk_wlatency
平均書き込みレイテンシ。
ミリ秒
2.15
disk_util
ディスクのI/O使用率。
パーセント (%)
0.27
disk_space_usage
使用されているディスク容量の割合。
パーセント (%)
9.12
disk_inode_usage
使用されるインデックスノード (inode) スペースの割合。
パーセント (%)
1.18
disk_space_used
使用されているディスク容量。
Byte
11068512238.59
disk_space_total
ディスク容量の合計。
Byte
126692061184.0
disk_inode_total
inodeの総数。
非該当
7864320.0
disk_inode_used
使用されたinodeの数。
非該当
93054.78
ネットワーク関連のメトリクス
メトリック
説明
単位
値の例
net_drop_util
すべてのパケットに対する破棄されたパケットの割合。
パーセント (%)
0.0
net_err_util
すべてのパケットに対するエラーパケットの割合。
パーセント (%)
0.0
net_in
1秒あたりに受信されるデータの量。
Byte/s
8440.91
net_in_pkt
1秒あたりに受信されるパケットの数。
パケット /秒
40.83
net_out
1秒あたりに送信されるデータ量。
Byte/s
12446.53
net_out_pkt
1秒あたりに送信されるパケットの数。
パケット /秒
39.95
TCP関連のメトリック
メトリック
説明
単位
値の例
protocol_tcp_established
確立された接続の数。
非該当
205.0
protocol_tcp_insegs
受信したパケットの数。
非該当
4654.0
protocol_tcp_outsegs
送信されたパケットの数。
非該当
4870.0
protocol_tcp_retran_segs
再送信されたパケットの数。
非該当
0.0
protocol_tcp_retran_util
送信パケットに対する再送信パケットの割合。
パーセント (%)
0.0
システム関連のメトリクス
メトリック
説明
単位
値の例
system_boot_time
システム起動時間。
秒
1578461935.0
system_load1
1分ごとの平均システム負荷。
非該当
0.58
system_load5
5分ごとの平均システム負荷。
非該当
0.68
system_load15
15分ごとの平均システム負荷。
非該当
0.60