このトピックでは、Elastic Compute Service (ECS) インスタンスの起動時にダウンタイムが発生し、RIP:get_target_pstate_use_performanceメッセージがログに表示される問題の解決策について説明します。
問題の説明
ECSインスタンスの起動時にダウンタイムが発生し、次のようなコールスタックが表示されます。
[ 1.076899] 分割エラー: 0000 [#1] SMP
[1.077669] でリンクされたモジュール:
[1.078302] CPU: 4 PID: 9 Comm: rcu_sched汚染されていない3.10.0-1127.19.1.el7.x86_64 #1
[1.079519] ハードウェア名: Alibaba Cloud ECS、BIOS 8f19b21 2014年4月1日
[1.080724] タスク: ffff91c8fa111070 ti: ffff91c8fa11c000 task.ti: ffff91c8fa11c000
[1.081919] RIP: 0010:[<ffffffff85dc3089>] [<ffffff85dc3089>] get_target_pstate_use_performance + 0x2 9/0xc0
[1.083355] RSP: 0000:ffff91c8fa11fb40 EFLAGS: 00010006
[1.093192] トレースを呼び出す:
[1.093715] [<ffffffff85dc4081>] intel_pstate_update_util + 0x16 1/0x310
[1.094550] [<ffffffffff858e9523>] ? load_balance + 0x1a 3/0xa10
[1.095321] [<ffffffffff858e4e87>] update_curr + 0x12 7/0x1e0
[1.096123] [<ffffffff858e52a8>] dequeue_entity + 0x2 8/0x5c0
[1.096894] [<ffffffffff8586d3be>] ? kvm_sched_clock_read + 0x 1e/0x30
[1.097702] [<ffffffff858e5893>] dequeue_task_fair + 0x5 3/0x660
[1.098490] [<ffffffff858debe5>] ? sched_clock_cpu + 0x8 5/0xc0
[1.099266] [<ffffffffff858d7a56>] deactivate_task + 0x4 6/0xd 0
原因
ECSインスタンスが起動すると、Intel pstateドライバーのcurrent_pstate
パラメーターの頻度値は0に初期化されます。 システムがプロセスを切り替えたときにシステム負荷が変化した場合は、CPUのパフォーマンスを調整するためにIntel pstateドライバが使用されます。 Intel pstateドライバーは、current_pstate
パラメーターの頻度値として0を使用します。これにより、0による除算エラーが発生します。
解決策
重要
問題が発生したインスタンスでソリューションの操作を実行する前に、インスタンスのスナップショットを作成してデータをバックアップすることを推奨します。 これにより、偶発的な操作によるデータの損失を防ぎます。 スナップショットの作成方法については、「ディスクのスナップショットの作成」をご参照ください。
インスタンスオペレーティングシステムのカーネルバージョンを4.18以降にアップグレードすることを推奨します。