このトピックでは、LoadBalancerサービスの診断手順とエラーのトラブルシューティング方法について説明します。
背景情報
サービスのタイプがtype=LoadBalancer
に設定されている場合、Container Service for Kubernetes (ACK) のクラウドコントローラマネージャー (CCM) は、SLBインスタンス、リスナー、バックエンドサーバーグループなど、サービスのServer Load Balancer (SLB) リソースを自動的に作成または構成します。 SLBリソースの自動更新に使用されるポリシーの詳細については、「LoadBalancerサービスの設定に関する考慮事項」をご参照ください。
手順
トラブルシューティングの前に、CCMのバージョンが1.9.3.276 g372aa98-aliyun以降であることを確認してください。 CCMの更新方法の詳細については、「CCMの更新」をご参照ください。CCMのリリースノートの詳細については、「Cloud Controller Manager」をご参照ください。
次のコマンドを実行して、SLBインスタンスに関連付けられているサービスを照会します。
kubectl get svc -A | grep -i LoadBalancer | grep ${XXX.XXX.XXX} #XXX.XXX.XXX.XXXはSLBインスタンスのIPアドレスです。
次のコマンドを実行して、サービスエラーに対してイベントが生成されるかどうかを確認します。
kubectl -n {your-namespace} describe svc {your-svc-name}
重要サービスエラーに対してイベントが生成されない場合は、CMMのバージョンが1.9.3.276 g372aa98-aliyun以降であるかどうかを確認します。 CCMの更新方法の詳細については、「CCMの更新」をご参照ください。
サービスエラーに対してイベントが生成される場合は、「サービスエラーと解決策」をご参照ください。
サービスエラーに対してイベントが生成されない場合は、「トラブルシューティング」をご参照ください。
問題が解決しない場合は、チケットの送信します。
サービスエラーと解決策
次の表に、サービスで発生したエラーを修正する方法を示します。
エラーメッセージ | 説明とソリューション |
| バックエンドサーバーのクォータが不足しています。 解決策: この問題を解決するには、次の方法を使用できます。
|
| 共有リソースSLBインスタンスは、elastic network Interface (ENI) をサポートしていません。 解決策: ENIをバックエンドサーバーとして指定する場合は、高性能SLBインスタンスを作成します。 重要 追加する注釈がCCMバージョンの要件を満たしていることを確認してください。 アノテーションとCCMバージョンの相関関係の詳細については、「一般的なアノテーション」をご参照ください。 |
| SLBインスタンスに関連付けられているバックエンドサーバーはありません。 ポッドがサービスに関連付けられているかどうか、およびポッドが通常どおり実行されるかどうかを確認します。 解決策:
|
| サービスをSLBインスタンスに関連付けることができません。 解決方法: SLBコンソールにログインし、
|
| アカウントで延滞が発生している場合。 |
| アカウントの残高が不足しています。 |
| SLBに対してAPIスロットリングがトリガーされます。 解決策:
|
| vServerグループに関連付けられているリスナーは削除できません。 解決策:
|
| 再利用された内部向けSLBインスタンスとクラスターは、同じ仮想プライベートクラウド (VPC) にデプロイされていません。 解決策: SLBインスタンスとクラスターが同じVPCにデプロイされていることを確認します。 |
| vSwitchのアイドルIPアドレスが不足しています。 解決策: |
|
解決策: Service YAMLファイルの |
| デフォルトでは、旧バージョンのCCMは自動的に共有リソースSLBインスタンスを作成し、購入できなくなりました。 解決策: CCMの更新。 |
| リソースグループの作成後、SLBインスタンスのリソースグループを変更することはできません。 解決策: |
| ENIの指定されたIPアドレスがVPCに見つかりません。 解決策: |
| サービスで使用されるSLBインスタンスの課金方法を従量課金から従量課金に変更することはできません。 解決策:
|
| CCMによって作成されたSLBインスタンスは再利用されます。 解決策:
|
| 作成後にSLBインスタンスのタイプを変更することはできません。 解決策: 関連するサービスを再作成します。 |
| SLBインスタンスを、すでに別のSLBインスタンスに関連付けられているサービスに関連付けることはできません。 解決策: |
トラブルシューティング
次の表に示す情報を参照して、サービスエラー以外のエラーのトラブルシューティングを行うことができます。
カテゴリ | 問題 | 解決策 |
SLBインスタンスにアクセスするときに発生する問題 | SLBインスタンスはトラフィックを均等に分散しません。 | |
アプリケーションの更新中にSLBインスタンスにアクセスすると、503エラーが発生します。 | ||
クラスター内からSLBインスタンスにアクセスすることはできません。 | ||
クラスターの外部からSLBインスタンスにアクセスすることはできません。 | ||
リクエストがHTTPSポートに送信されると、 | ||
SLB設定に関連する問題 | サービスの注釈は有効になりません。 | |
SLBインスタンスの設定が変更されました。 | ||
既存のSLBインスタンスを再利用できません。 | ||
既存のSLBインスタンスを再利用する場合、リスナーは作成されません。 | ||
サービスのエンドポイントは、SLBインスタンスのバックエンドサーバーに指定されたエンドポイントとは異なります。 | ||
SLBの削除に関連する問題 | SLBインスタンスが削除されました。 | |
SLBインスタンスはサービスとともに削除されません。 |
SLBインスタンスがトラフィックを均等に分散しない
原因
SLBインスタンスに指定されたスケジューリングアルゴリズムが不適切です。
問題
トラフィックは、SLBインスタンスのバックエンドサーバーに均等に分散されません。
解決策
externalTrafficPolicy: Local
をサービスに設定した場合、Service. beta.kubernetes.io/alibaba-cloud-loadbalancer-scheduler:"WRR"
アノテーションをサービスに追加して、SLBインスタンスのスケジューリングアルゴリズムをwrr (加重ラウンドロビン) に設定します。サービスへの長期接続が確立されている場合は、
Service. beta.kubernetes.io/alibaba-cloud-loadbalancer-scheduler:"WLC"
アノテーションを追加して、SLBインスタンスのスケジューリングアルゴリズムをwlc (Weighted Least connections) に設定します。
アプリケーションの更新中にSLBインスタンスにアクセスすると503エラーが発生します
原因
接続のドレインがSLBリスナーに設定されていないか、またはポッドにグレースフルシャットダウンが設定されていません。
問題
アプリケーションの更新中にSLBインスタンスにアクセスすると、503エラーが発生します。
解決策
service.beta.kubernetes.io/alibaba-cloud-loadbalancer-connection-drain
アノテーションを追加して、SLBリスナーの接続トレーニングを設定します。 注釈の詳細については、「リスナーを管理する一般的な操作」をご参照ください。ポッドのネットワークモードに基づいて、ポッドの
preStop
パラメーターとreadinessProbe
パラメーターを設定します。readinessProbe
は、コンテナーがネットワークトラフィックを受け入れる準備ができているかどうかを確認します。 ポッドが準備完了プロービングに合格した場合にのみ、ポッドがエンドポイントに追加されます。 エンドポイントが更新されたことをACKが識別した場合にのみ、ノードがSLBインスタンスにアタッチされます。readinessProbe
には、適切なプロービング間隔、遅延期間、および異常しきい値を設定する必要があります。 短い期間を指定すると、アプリケーションポッドは繰り返し再起動します。preStop
の値を、アプリケーションポッドが残りのリクエストを処理するために必要な期間に設定することを推奨します。terminationGracePeriodSeconds
の値をpreStop
より30秒長い期間に設定することを推奨します。
ポッドの設定例:
apiVersion: v1 種類: ポッド メタデータ: name: nginx namespace: デフォルト spec: コンテナ: - name: nginx image: nginx # Livenessプロービング livenessProbe: failureThreshold: 3 initialDelaySeconds: 30 periodSeconds: 30 successThreshold: 1 tcpSocket: ポート: 5084 timeoutSeconds: 1 # 準備のプロービング readinessProbe: failureThreshold: 3 initialDelaySeconds: 30 periodSeconds: 30 successThreshold: 1 tcpSocket: ポート: 5084 timeoutSeconds: 1 # 優雅なシャットダウン ライフサイクル: preStop: exec: command: -睡眠 -30 terminationGracePeriodSeconds: 60
クラスター内からSLBインスタンスにアクセスできない
原因
externalTrafficPolicy: Local
はLoadBalancerに設定されます。 ローカルモードでは、LoadBalancerのIPアドレスは、ローカルノード (LoadBalancerを実行するノード) でプロビジョニングされたポッドからのみアクセスできます。 LoadBalancerのIPアドレスは、クラスター内の他のノードのポッドからアクセスできません。 LoadBalancerのIPアドレスはKubernetesクラスターの外部にあります。 ACKクラスター内のノードまたはポッドがセカンドホップを使用せずにIPアドレスにアクセスできない場合、リクエストはLoadBalancerを通過しません。 その結果、LoadBalancerのIPアドレスは、LoadBalancerを使用するサービスの拡張IPアドレスと見なされます。 リクエストは、iptablesまたはIP仮想サーバー (IPVS) に基づくkube-proxyによって転送されます。
このシナリオでは、要求されたポッドがローカルノードでプロビジョニングされていない場合、接続の問題が発生します。 LoadBalancerのIPアドレスは、要求されたポッドがローカルノードでプロビジョニングされている場合にのみアクセスできます。 詳細については、「」をご参照ください。kube-proxyが外部lbのアドレスをノードローカルiptablesルールに追加する理由?.
問題
クラスター内からSLBインスタンスにアクセスすることはできません。
解決策
クラスターIPまたはIngress名を使用します。
Ingress名は
nginx-ingress-lb.kubeシステム
です。LoadBalancerサービスのexternalTrafficPolicyをクラスターに設定します。 ただし、この場合、クライアントの送信元IPアドレスは保存できません。 Ingressを変更するには、次のコマンドを実行する必要があります。
説明SLBインスタンスがIngressによって使用されている場合、Ingressポッドをホストするノード上のポッドのみが、IngressまたはSLBインスタンスによって公開されているサービスにアクセスできます。
kubectl edit svc nginx-ingress-lb -n kube-system
クラスターがENIモードでTerwayを使用している場合、LoadBalancerサービスのexternalTrafficPolicyをクラスターに設定し、
アノテーション: Service. beta.kubernetes.io/backend-type:"eni"
などの形式でアノテーションを追加して、ENIに直接アクセスします。 これにより、クライアントの送信元IPアドレスを保持し、クラスター内からSLBインスタンスにアクセスできます。 詳細については、「CLBインスタンスを構成するためのサービスのYAMLファイルへのアノテーションの追加」をご参照ください。apiVersion: v1 種類: サービス メタデータ: アノテーション: service.beta.kubernetes.io/backend-type: eni ラベル: アプリ: nginx-ingress-lb 名前: nginx-ingress-lb 名前空間: kube-system spec: externalTrafficPolicy: クラスター
クラスターの外部からSLBインスタンスにアクセスできない
原因
SLBインスタンスのアクセス制御リスト (ACL) ルールを設定した場合、SLBインスタンスが通常どおりに実行されない場合。
問題
クラスターの外部からSLBインスタンスにアクセスすることはできません。
解決策
次のコマンドを実行して、サービスイベントを照会し、エラーをトラブルシューティングします。 詳細については、「サービスエラーと解決策」をご参照ください。
kubectl -n {your-namespace} describe svc {your-svc-name}
ACLルールがSLBインスタンスに設定されているかどうかを確認します。
SLBインスタンスにACLルールが設定されている場合は、クライアントIPアドレスがSLBインスタンスにアクセスできるかどうかを確認します。 SLBインスタンスのACLルールを設定する方法の詳細については、「アクセス制御の概要」をご参照ください。
SLBインスタンスがvServerグループに関連付けられているかどうかを確認します。
vServerグループが関連付けられていない場合は、アプリケーションポッドがサービスに関連付けられているかどうか、およびアプリケーションポッドが通常どおり実行されているかどうかを確認します。 アプリケーションポッドが正常に実行されない場合は、原因を特定してエラーのトラブルシューティングを行います。 詳細については、「ポッドのトラブルシューティング」をご参照ください。
異常なバックエンドサーバーがSLBリスナーによって検出されたかどうかを確認します。
異常なバックエンドサーバーが検出された場合は、アプリケーションポッドが正常に実行されているかどうかを確認します。 SLBのヘルスチェックの詳細については、「ヘルスチェックスクリプトの実行」をご参照ください。
問題が解決しない場合は、チケットの送信します。
バックエンドHTTPSサービスにアクセスできません
原因
SLBインスタンスで証明書情報を指定すると、SLBインスタンスはHTTPSリクエストを復号化し、HTTPリクエストをバックエンドポッドに送信します。
問題
バックエンドHTTPSサービスにアクセスできません。
解決策
サービスのHTTPポートにtargetPortを設定します。 targetPortは、HTTPSポートがマッピングされるポートを指定します。 たとえば、HTTPSポートは次のNGINXサービスで443されます。 この場合、targetPort
の値を80
に変更する必要があります。
例:
apiVersion: v1
種類: サービス
メタデータ:
アノテーション:
service.beta.kubernetes.io/alibaba-cloud-loadbalancer-protocol-port: "https:443"
service.beta.kubernetes.io/alibaba-cloud-loadbalancer-cert-id: "${YOUR_CERT_ID}"
name: nginx
namespace: デフォルト
spec:
ポート:
- port: 80
protocol: TCP
targetPort: 80
- port: 443
protocol: TCP
targetPort: 80
セレクタ:
run: nginx
タイプ: LoadBalancer