Elastic Compute Service (ECS) インスタンスがダウンし、エラーログにOut of memory and no killable processesエラーメッセージが表示された場合は、このトピックで説明されているソリューションを使用して問題を解決できます。
問題の説明
インスタンスが実行時にダウンし、次のようなコールスタックが表示されます。
[28663.625353] [ pid ] uid tgid total_vm rss nr_ptes nr_pmds swapents oom_score_adj名
[28663.625363] [ 1799] 0 1799 26512 245 56 3 0 -1000 sshd
[28663.625367] [29219] 0 29219 10832 126 26 3 0 -1000 systemd-udevd
[28663.625375] カーネルパニック-同期していない: メモリの不足と殺されるプロセスはありません...
[28663.634374] CPU: 1 PID: 3578 Comm: kworker/u176:4汚染: G OE 3.10.0-1062.9.1.el7.x86_64 #1
[28663.676873] トレースを呼び出す:
[28663.679312] [<ffffffffff8139f342>] dump_stack + 0x6 3/0x81
[28663.684421] [<ffffffffff811b2245>] パニック + 0xf 8/0x244
[28663.689184] [<ffffffffff811b98db>] out_of_memory + 0x 2eb/0x550
[28663.694726] [<ffffffffff811be254>] ___alloc_pages_may_oom + 0x11 4/0x1c0
[28663.700959] [<ffffffffff811bedb3>] ___alloc_pages_slowpath + 0x7d 3/0xa40
[28663.707279] [<ffffffffff811bf229>] ___alloc_pages_nodemask + 0x20 9/0x260
[28663.713599] [<ffffffff81216535>] alloc_pages_current + 0x9 5/0x140
[28663.719573] [<ffffffffff811ba5ee>] __get_free_pages + 0xe/0x40
[28663.725113] [<ffffffffff81075dae>] pgd_alloc + 0x 1e/0x160
[28663.730225] [<ffffffffff810875e4>] mm_init + 0x18 4/0x240
[28663.735249] [<ffffffffff81088102>] mm_alloc + 0x5 2/0x60
[28663.740186] [<ffffffff81257640>] do_execveat_common.isra.37 + 0x25 0/0x780
[28663.759839] [<ffffffffff81257b9c>] do_execve + 0x 2c/0x30
[28663.764864] [<ffffffffff810a231b>] call_usermodehelper_exec_async + 0xfb/0x150
[28663.777246] [<ffffffffff81741dd9>] ret_from_fork + 0x3 9/0x50
発生源
インスタンスのオペレーティングシステムカーネルがプロセスへのメモリの割り当てに失敗し、一部のプロセスを終了してメモリを解放しようとすると、インスタンスで実行されているプロセスを終了できません。 その結果、インスタンスがダウンします。 この問題は、オペレーティングシステムのカーネルでメモリリークが発生した場合や、oom_score_adj
の値が -1000
に設定されているプロセスでメモリが過剰に使用され、終了できない場合に発生する可能性があります。 どちらの場合も、システム内の使用可能なメモリが不十分です。
対応策
重要 操作を実行する前に、偶発的な操作によるデータ損失を防ぐために、ECSインスタンスのスナップショットを作成してデータをバックアップすることを推奨します。 スナップショットの詳細については、「スナップショットの概要」をご参照ください。
次のチェックを実行します。
- メモリリークが発生していないか確認してください。 詳細については、「t2118313.html#task_2118313」をご参照ください。
oom_score_adj
の値が正しく設定されているかどうかを確認します。