次の方法で共有


Azure Kubernetes Service のバックアップと復元のトラブルシューティングを行う

この記事では、Azure Kubernetes Service (AKS) のバックアップ、復元、管理のエラーを解決するうえで役立つトラブルシューティング手順について説明します。

AKS Backup Extension のインストール エラーの解決策

シナリオ 1

エラー メッセージ:

{Helm installation from path [] for release [azure-aks-backup] failed with the following error: err [release azure-aks-backup failed, and has been uninstalled due to atomic being set: failed post-install: timed out waiting for the condition]} occurred while doing the operation: {Installing the extension} on the config"`

原因: 拡張機能は正常にインストールされましたが、ポッドに必要なコンピューティングとメモリがを使用できないため、ポッドは生成されません。

解決策: この問題を解決するには、クラスター内のノード数を増やして、ポッドの生成に十分なコンピューティングとメモリを使用できるようにします。 Azure portal でノード プールをスケーリングするには、次の手順に従います。

  1. Azure portal で、AKS クラスターを開きます。
  2. [設定][ノード プール] に移動します。
  3. [ノード プールのスケーリング] を選択し、[ノード数範囲] の最小値と最大値を更新します。
  4. [適用] を選択します。

シナリオ 2

エラー メッセージ:

BackupStorageLocation "default" is unavailable: rpc error: code = Unknown desc = azure.BearerAuthorizer#WithAuthorization: Failed to refresh the Token for request to https://management.azure.com/subscriptions/aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e/resourceGroups/AzureBackupRG_westeurope_1/providers/Microsoft.Storage/storageAccounts/devhayyabackup/listKeys?%24expand=kerb&api-version=2019-06-01: StatusCode=404 -- Original Error: adal: Refresh request failed. Status Code = '404'. Response body: no azure identity found for request clientID 4e95##### REDACTED #####0777`

Endpoint http://169.254.169.254/metadata/identity/oauth2/token?api-version=2018-02-01&client_id=4e95dcc5-a769-4745-b2d9-

原因: AKS クラスターでポッドマネージド ID を有効にすると、aks-addon-exception という名前の AzurePodIdentityExceptionkube-system 名前空間に追加されます。 AzurePodIdentityException を使用すると、NMI サーバーによって傍受されることなく、特定のラベルがあるポッドから Azure Instance Metadata Service (IMDS) エンドポイントにアクセスできます。

拡張機能ポッドは除外されないため、Microsoft Entra ID ポッド ID を手動で有効にする必要があります。

解決策: AKS クラスターに pod-identity 例外を作成します (これは dataprotection-microsoft 名前空間と not kube-system に対してのみ機能します)。 詳細については、こちらを参照してください

  1. 次のコマンドを実行します。

    az aks pod-identity exception add --resource-group shracrg --cluster-name shractestcluster --namespace dataprotection-microsoft --pod-labels app.kubernetes.io/name=dataprotection-microsoft-kubernetes
    
  2. クラスター内の Azurepodidentityexceptions を確認するには、次のコマンドを実行します。

    kubectl get Azurepodidentityexceptions --all-namespaces
    
  3. "ストレージ BLOB データ共同作成者" ロールを拡張機能 ID に割り当てるには、次のコマンドを実行します。

    最新の Terraform スクリプト バージョンを使用していることを確認します。 詳細については、こちらを参照してください

    az role assignment create --assignee-object-id $(az k8s-extension show --name azure-aks-backup --cluster-name aksclustername --resource-group aksclusterresourcegroup --cluster-type managedClusters --query aksAssignedIdentity.principalId --output tsv) --role 'Storage Blob Data Contributor' --scope /subscriptions/subscriptionid/resourceGroups/storageaccountresourcegroup/providers/Microsoft.Storage/storageAccounts/storageaccountname
    

シナリオ 3

エラー メッセージ:

{"Message":"Error in the getting the Configurations: error {Post \https://centralus.dp.kubernetesconfiguration.azure.com/subscriptions/ subscriptionid /resourceGroups/ aksclusterresourcegroup /provider/managedclusters/clusters/ aksclustername /configurations/getPendingConfigs?api-version=2021-11-01\: dial tcp: lookup centralus.dp.kubernetesconfiguration.azure.com on 10.63.136.10:53: no such host}","LogType":"ConfigAgentTrace","LogLevel":"Error","Environment":"prod","Role":"ClusterConfigAgent","Location":"centralus","ArmId":"/subscriptions/ subscriptionid /resourceGroups/ aksclusterresourcegroup /providers/Microsoft.ContainerService/managedclusters/ aksclustername ","CorrelationId":"","AgentName":"ConfigAgent","AgentVersion":"1.8.14","AgentTimestamp":"2023/01/19 20:24:16"}`

原因: AKS クラスターでクラスター拡張機能を使用するには、特定の FQDN/アプリケーション規則が必要です。 詳細については、こちらを参照してください

このエラーは、これらの FQDN 規則がないために、クラスター拡張機能サービスからの構成情報が使用できなかったことから発生します。

解決方法: この問題を解決するには、パブリック ネットワークを通過する DP エンドポイントに対して CoreDNS-custom オーバーライドを作成する必要があります。

  1. クラスター内の既存の CoreDNS-custom YAML を取得します (後で参照できるようにローカルに保存します)。

    kubectl get configmap coredns-custom -n kube-system -o yaml
    
  2. centralus DP エンドポイントのパブリック IP へのマッピングをオーバーライドします (以下の YAML を使います)。

    apiVersion: v1
    kind: ConfigMap
    metadata:
      name: coredns-custom 
      namespace: kube-system
    data:
        aksdp.override: |
              hosts { 
                  20.40.200.153 centralus.dp.kubernetesconfiguration.azure.com
                  fallthrough
               }
    

    次に、以下のコマンドを実行して、更新の yaml ファイルを適用します。

    kubectl apply -f corednsms.yaml
    
  3. coredns ポッドを強制的に再読み込みするには、次のコマンドを実行します。

    kubectl delete pod --namespace kube-system -l k8s-app=kube-dns
    
  4. NSlookup ポッドから を実行して coreDNS-custom が動作しているかどうかを確認するには、次のコマンドを実行します。

    kubectl exec -i -t pod/extension-agent-<pod guid that's there in your cluster> -n kube-system -- nslookup centralus.dp.kubernetesconfiguration.azure.com
    
  5. ExtensionAgent ポッドのログを確認するには、次のコマンドを実行します。

    kubectl logs pod/extension-agent-<pod guid that’s there in your cluster> -n kube-system --tail=200
    
  6. バックアップ拡張機能を削除して再インストールし、バックアップを開始します。

シナリオ 4

エラー メッセージ:

"message": "Error: [ InnerError: [Helm installation failed : Unable to create/update Kubernetes resources for the extension : Recommendation Please check that there are no policies blocking the resource creation/update for the extension : InnerError [release azure-aks-backup failed, and has been uninstalled due to atomic being set: failed pre-install: job failed: BackoffLimitExceeded]]] occurred while doing the operation : [Create] on the config, For general troubleshooting visit: https://aka.ms/k8s-extensions-TSG, For more application specific troubleshooting visit: Facing trouble? Common errors and potential fixes are detailed in the Kubernetes Backup Troubleshooting Guide, available at https://www.aka.ms/aksclusterbackup",

クラスターで、アップグレード CRD のプレインストール ジョブが失敗しています。

原因: ポッドが Kube API Server と通信できない

デバッグ

  1. ポッドの生成の問題に関連するクラスター内のイベントを確認します。
kubectl events -n dataprotection-microsoft
  1. データ保護 CRD のポッドを確認します。
kubectl get pods -A | grep "dataprotection-microsoft-kubernetes-agent-upgrade-crds"
  1. ポッドのログを確認します。
kubectl logs -f --all-containers=true --timestamps=true -n dataprotection-microsoft <pod-name-from-prev-command>

ログ メッセージの例:

2024-08-09T06:21:37.712646207Z Unable to connect to the server: dial tcp: lookup aks-test.hcp.westeurope.azmk8s.io: i/o timeout
2024-10-01T11:26:17.498523756Z Unable to connect to the server: dial tcp 10.146.34.10:443: i/o timeout

解決策: この場合、dataprotection-microsoft ポッドが API サーバーと通信することを許可していない Network/Calico ポリシーまたは NSG があります。 dataprotection-microsoft 名前空間を許可し、拡張機能を再インストールする必要があります。

シナリオ 5

拡張機能エージェントがデータ プレーン エンドポイントとの通信に失敗し、拡張機能ポッドがデプロイされないバックアップが発生しました。

エラー メッセージ: AKS クラスター内の拡張機能エージェントが、お使いのリージョンに *.dp.kubernetesconfiguration.azure.com Azure Kubernetes Configuration サービスのデータ プレーン エンドポイントに接続できませんでした。 このエラーは、 extension-agent ポッドのログを確認することによって示されます。 データ プレーン エンドポイントへの要求に対して 403 エラーが繰り返し発生する可能性があります

Error code: 403  
Message: This traffic is not authorized

これは通常、拡張機能エージェントからのトラフィックがブロックされているか、Azure サービスに到達するために必要な承認がないことを意味します。 この拡張機能エージェントは、AKS クラスターにバックアップ拡張機能をインストールして実行するために必要です。

原因 このエラーは、Azure Arc 対応 Kubernetes と AKS マネージド クラスターの両方が同じ仮想ネットワーク (VNet) またはプライベート DNS サーバーを共有している場合に、プライベート DNS 解決の競合が原因で発生します。

共有 VNet (またはプライベート DNS ゾーン) には、Azure Arc 対応 Kubernetes の既存のプライベート エンドポイントが含まれています。

その結果、AKS 拡張エージェント (*.dp.kubernetesconfiguration.azure.com など) によって使用されるデータ プレーン エンドポイントは、目的のパブリック IP ではなくプライベート IP アドレス (例: 10.x.x.x) に解決されます。

この誤ったルーティングにより、AKS 拡張機能エージェントは意図しないプライベート エンドポイントにトラフィックを送信し、403 の未承認エラーが発生します。 次のコマンドを使用して、AKS クラスター内からデータ プレーン エンドポイントの解決済み IP アドレスを確認できます。

kubectl exec -it -n kube-system extension-agent-<podGuid> --nslookup <region>.dp.kubernetesconfiguration.azure.com

regionを特定の Azure リージョン (eastus、westeurope など) に置き換えます。

解決 この問題を解決するには、次の方法を検討してください。

  • 個別の VNet を使用する: Azure Arc 対応 Kubernetes クラスターと AKS クラスターの両方を使用している場合は、それらを別の仮想ネットワークにデプロイして、共有プライベート エンドポイントによって発生する DNS 解決の競合を回避します。

  • CoreDNS オーバーライドの構成: AKS クラスターの CoreDNS 設定をオーバーライドして、拡張データ プレーン エンドポイントをパブリック IP アドレスに明示的に解決します。 拡張機能の CoreDNS オーバーライドを構成する詳細な手順については、ドキュメントのシナリオ 3 を参照してください。

  • パブリック IP 解決の確認: nslookup コマンドを使用して、拡張データ プレーン エンドポイントの正しいパブリック IP アドレスを特定します。 リージョンを AKS クラスターのリージョンに置き換えます。

nslookup eastus2euap.dp.kubernetesconfiguration.azure.com

インストール後のバックアップ拡張機能に関連するエラー

これらのエラー コードは、AKS クラスターにインストールされたバックアップ拡張機能の問題が原因で表示されます。

KubernetesBackupListExtensionsError:

原因: バックアップ コンテナーは、検証の一環としてクラスターにバックアップ拡張機能がインストールされているかどうかを確認します。 このため、コンテナー MSI には、クラスターにインストールされているすべての拡張機能の一覧表示を許可する AKS クラスターでの閲覧者アクセス許可が必要です。

推奨されるアクション: 割り当てられた閲覧者ロールに list-extension アクセス許可が不足しているため、閲覧者ロールをコンテナー MSI に再度割り当てます (既存のロールの割り当てを削除し、閲覧者ロールを再度割り当てます)。 再割り当てが失敗した場合は、別のバックアップ コンテナーを使用してバックアップを構成します。

ユーザーエラーKubernetesバックアップ拡張機能が見つかりませんエラー

原因: バックアップ コンテナーは、検証の一環としてクラスターにバックアップ拡張機能がインストールされているかどうかを確認します。 コンテナーは、クラスターにインストールされている拡張機能を一覧表示する操作を実行します。 バックアップ拡張機能が一覧に存在しない場合は、このエラーが表示されます。

推奨されるアクション: CL または Azure portal クライアントを使用して拡張機能を削除した後、拡張機能を再度インストールします。

ユーザーエラー: Kubernetesバックアップ拡張機能にエラーがあります

原因: クラスターにインストールされているバックアップ拡張機能に、いくつかの内部エラーがあります。

推奨されるアクション: CL または Azure portal クライアントを使用して拡張機能を削除した後、拡張機能を再度インストールします。

Kubernetesバックアップ拡張IDが見つかりません (UserError)

原因: AKS バックアップでは、クラスターにバックアップ拡張機能がインストールされていることが必要です。 拡張機能にはインストールに伴い、拡張機能 MSI と呼ばれるユーザー ID が作成されて付与されます。 この MSI は、AKS クラスターのノード プールを構成するリソース グループに作成されます。 この MSI には、バックアップ ストレージの場所へのアクセスに必要なロールが割り当てられます。 このエラー コードは、拡張機能 ID が見つからないことを示しています。

推奨されるアクション: CLI または Azure portal クライアントを使用して拡張機能を削除した後、拡張機能を再度インストールします。 拡張機能と共に新しい ID が作成されます。

KubernetesBackupCustomResourcesTrackingTimeOutError

原因: Azure Backup for AKS では、クラスターにバックアップ拡張機能がインストールされていることが必要です。 バックアップおよび復元操作を実行するために、クラスターにはカスタム リソースが作成されます。 拡張機能によって生成されるポッドは、これらの CR を介してバックアップ関連の操作を実行します。 このエラーは、拡張機能がこれらの CR の状態を更新できない場合に発生します。

推奨されるアクション: 拡張機能の正常性は、コマンド kubectl get pods -n dataprotection.microsoft を実行することで検証する必要があります。 ポッドが実行中状態でない場合は、クラスター内のノードの数を 1 だけ増やすか、コンピューティング制限を引き上げます。 その後、数分待ってからコマンドを再度実行します。これによって、ポッドの状態が "実行中" に変化するはずです。 問題が続く場合は、拡張機能を削除して再インストールします。

ユーザーエラー: バックアップ中にプラグイン・ポッドが再起動されました

原因: Azure Backup for AKS は、名前空間 dataprotection-microsoftのバックアップ拡張機能の一部として AKS クラスター内にデプロイされたポッドに依存しています。 バックアップと復元の操作を実行するために、これらのポッドには特定の CPU とメモリの要件があります。

       1. Memory: requests - 128Mi, limits - 1280Mi
       2. CPU: requests - 500m, limits - 1000m

ただし、クラスター内のリソースの数が 1000 を超える場合、ポッドでは既定の予約を超える追加の CPU とメモリが必要になることがあります。 必要なリソースが割り当てられた制限を超えると、バックアップ操作中に OOMKilled (メモリ不足) エラーが原因で UserErrorBackupPluginPodRestartedDuringBackup エラーが発生する可能性があります。

推奨されるアクション: バックアップ操作と復元操作を確実に成功させるには、次の手順に従って拡張機能ポッドのリソース設定を手動で更新します。

  1. Azure portal で AKS クラスターを開きます。

    Azure portal の AKS クラスターを示すスクリーンショット。

  2. 左側のウィンドウの [設定] の下にある [拡張機能とアプリケーション] に移動します。

    [拡張機能とアプリケーション] を選択する方法を示すスクリーンショット。

  3. "azure-aks-backup" というタイトルの拡張機能をクリックします。

    バックアップ拡張機能の設定を開く方法を示すスクリーンショット。

  4. 下にスクロールし、[構成設定] で新しい値を追加し、[保存] をクリックします。

    resources.limits.memory : 4400Mi

    構成設定で値を追加する方法を示すスクリーンショット。

変更を適用した後、スケジュールされたバックアップが実行されるまで待つか、オンデマンド バックアップを開始します。 OOMKilled エラーがまだ発生する場合は、上記の手順を繰り返してメモリ制限を徐々に増やしてください。それでも問題が続く場合は、resources.limits.cpu の対応するパラメーターも増加してください。

拡張機能ポッドがプロビジョニングされているノードに必要な CPU またはメモリがない場合、リソースの制限のみを更新した場合、ポッドは繰り返し強制終了される可能性があります。 これを解決するには、 resources.requests.cpuresources.requests.memoryを使用して構成設定を更新します。 これにより、要求されたリソース要件を満たすノードでポッドがスケジュールされます。

復元中にバックアッププラグインのポッドが再起動されたユーザーエラー

原因: Azure Backup for AKS は、名前空間 dataprotection-microsoftのバックアップ拡張機能の一部として AKS クラスター内にデプロイされたポッドに依存しています。 バックアップと復元の操作を実行するために、これらのポッドには特定の CPU とメモリの要件があります。

       1. Memory: requests - 128Mi, limits - 1280Mi
       2. CPU: requests - 500m, limits - 1000m

ただし、クラスター内のリソースの数が 1000 を超える場合、ポッドでは既定の予約を超える追加の CPU とメモリが必要になることがあります。 必要なリソースが割り当てられた制限を超えた場合、復元操作中に OOMKilled (メモリ不足) エラーが原因で UserErrorBackupPluginPodRestartedDuringRestore エラーが発生する可能性があります。

推奨されるアクション: バックアップ操作と復元操作を確実に成功させるには、次の手順に従って拡張機能ポッドのリソース設定を手動で更新します。

  1. Azure portal で AKS クラスターを開きます。

    Azure portal の AKS クラスターを示すスクリーンショット。

  2. 左側のウィンドウの [設定] の下にある [拡張機能とアプリケーション] に移動します。

    [拡張機能とアプリケーション] を選択する方法を示すスクリーンショット。

  3. "azure-aks-backup" というタイトルの拡張機能をクリックします。

    バックアップ拡張機能の設定を開く方法を示すスクリーンショット。

  4. 下にスクロールし、[構成設定] で新しい値を追加し、[保存] をクリックします。

    resources.limits.memory : 4400Mi

    構成設定で値を追加する方法を示すスクリーンショット。

変更を適用した後、スケジュールされたバックアップが実行されるまで待つか、オンデマンド バックアップを開始します。 OOMKilled エラーがまだ発生する場合は、上記の手順を繰り返してメモリ制限を徐々に増やしてください。それでも問題が続く場合は、resources.limits.cpu の対応するパラメーターも増加してください。

拡張機能ポッドがプロビジョニングされているノードに必要な CPU またはメモリがない場合、リソースの制限のみを更新した場合、ポッドは繰り返し強制終了される可能性があります。 これを解決するには、 resources.requests.cpuresources.requests.memoryを使用して構成設定を更新します。 これにより、要求されたリソース要件を満たすノードでポッドがスケジュールされます。

バックアッププラグイン削除バックアップ操作失敗

原因: バックアップを削除するには、バックアップ拡張機能が実行されている必要があります。

推奨されるアクション: クラスターが実行されている場合は、拡張機能が正常な状態で実行されているかどうかを確認します。 拡張機能ポッドが生成されているかどうかを確認して、生成されていなければ、ノードを増やします。 これが失敗する場合は、拡張機能の削除と再インストールを試します。 バックアップ クラスターが削除されたら、スナップショットとメタデータを手動で削除します。

バックアップアイテムの同期を待つ中で拡張機能がタイムアウトしました

原因: バックアップ拡張機能は、バックアップ アイテムがストレージ アカウントと同期されるまで待機します。

推奨されるアクション: このエラー コードが表示された場合は、バックアップ操作を再試行するか、拡張機能を再インストールします。

バックアップ ストレージの場所に基づくエラー

これらのエラー コードは、AKS クラスターにインストールされたバックアップ拡張機能に基づく問題が原因で表示されます。

UserErrorDeleteBackupFailedBackupStorageLocationReadOnly

原因: バックアップ拡張機能のインストール時に入力として指定されたストレージ アカウントが "読み取り専用" 状態であり、BLOB コンテナーからバックアップ データを削除することができません。

推奨されるアクション: ストレージ アカウントの状態を "読み取り専用" から "書き込み" に変更します。

ユーザーエラー: バックアップ削除失敗 - バックアップストレージ場所が見つかりません

原因: 拡張機能のインストール中には、バックアップ ストレージの場所を、ストレージ アカウントと BLOB コンテナーを含む入力として指定する必要があります。 このエラーは、拡張機能のインストール中に場所が削除されたか、誤って追加された場合に表示されます。

推奨されるアクション: バックアップ拡張機能を削除した後、正しいストレージ アカウントと BLOB コンテナーを入力として再インストールします。

ユーザーエラー バックアップ失敗 バックアップが格納されている場所は読み取り専用です。

原因: バックアップ拡張機能のインストール時に入力として指定されたストレージ アカウントが "読み取り専用" 状態であり、BLOB コンテナーにバックアップ データを書き込むことができません。

推奨されるアクション: ストレージ アカウントの状態を "読み取り専用" から "書き込み" に変更します。

デフォルトのバックアップストレージ位置が見つかりませんでした

原因: 拡張機能のインストール中には、バックアップ ストレージの場所を、ストレージ アカウントと BLOB コンテナーを含む入力として指定する必要があります。 このエラーは、拡張機能のインストール中に場所が削除されたか、誤って入力された場合に表示されます。

推奨されるアクション: バックアップ拡張機能を削除した後、正しいストレージ アカウントと BLOB コンテナーを入力として再インストールします。

UserErrorExtensionMSIMissingPermissionsOnBackupStorageLocation

原因: バックアップ拡張機能には、バックアップ ストレージの場所 (ストレージ アカウント) での "ストレージ BLOB データ共同作成者" ロールが必要です。 拡張機能 ID には、このロールが割り当てられます。

推奨されるアクション: このロールが不足している場合は、Azure portal または CLI を使用して、この不足しているストレージ アカウント上のアクセス許可を再度割り当てます。

バックアップストレージの場所の準備ができていませんユーザーエラー

原因: 拡張機能のインストール中には、バックアップ ストレージの場所を、ストレージ アカウントと BLOB コンテナーを含む入力として指定する必要があります。 バックアップ拡張機能には、バックアップ ストレージの場所 (ストレージ アカウント) での "ストレージ BLOB データ共同作成者" ロールが必要です。 拡張機能 ID には、このロールが割り当てられます。

推奨されるアクション: このエラーは、拡張機能 ID にストレージ アカウントにアクセスするための適切なアクセス許可がない場合に表示されます。 このエラーは、保護操作を構成する際に初めて AKS バックアップ拡張機能がインストールされる場合に表示されます。 これは、付与されたアクセス許可が AKS バックアップ拡張機能に反映されるまでに時間がかかるため発生します。 回避策として、1 時間待ってから保護構成を再試行します。 あるいは、Azure portal または CLI を使用して、この不足しているストレージ アカウント上のアクセス許可を再割り当てします。

ユーザーエラー: スナップショットリソースグループにロックがあります

原因: このエラー コードは、バックアップ拡張機能の入力として指定されたスナップショット リソース グループに削除ロックまたは読み取りロックが適用されているときに表示されます。

推奨されるアクション: 新しいバックアップ インスタンスを構成する場合は、削除ロックまたは読み取りロックがないリソース グループを使用します。 バックアップ インスタンスが既に構成されている場合は、スナップショット リソース グループからロックを削除します。

Kubernetesバックアップ一般警告

原因: このエラー コードは、Kubernetes リソースをバックアップまたは復元できなかったことを示します。通常は、クラスター内の検証または依存関係の問題が原因です。

一般的に観察されるシナリオの 1 つは、Webhook の検証に関する問題によるイングレス リソースの復元中のエラーです。 必要なサービス (fabp-ingress-nginx-controller-admission など) が不足しているため、webhook validate.nginx.ingress.kubernetes.io が正しく実行されません。 検証 Webhook 構成は存在しますが、存在しないサービスまたは正しく構成されていないサービスを参照しています。 DNS 解決の問題により、Webhook が目的のエンドポイントに到達できません。 クラスターでは、復元前にバックアップまたは再作成されなかったカスタム アドミッション Webhook が使用されます。 Webhook 構成は古い形式であるか、復元されたクラスターの状態では不要です。

推奨される操作:

  • 次を使用して、不足しているサービス fabp-ingress-nginx-controller-admission が存在するかどうかを確認します。

    kubectl get svc -n ingress-basic
    
  • サービスがない場合は、デプロイ構成を確認し、必要に応じて再作成します。

  • 次を実行して、潜在的な DNS 解決の問題を調査します。

    kubectl get endpoints -n ingress-basic
    
    nslookup fabp-ingress-nginx-controller-admission.ingress-basic.svc.cluster.local
    
  • webhook 検証が不要な場合は、次を使用して削除することを検討してください。

    kubectl delete validatingwebhookconfiguration
    
  • 次を使用して、すべての Webhook 構成を一覧表示します。

    kubectl get validatingwebhookconfigurations
    
  • 問題が解決した場合は、YAML バックアップを適用してイングレスを手動で復元します。

    kubectl apply -f
    

この警告は、複数の原因から発生する可能性があります。 上記の手順で問題が解決しない場合は、Kubernetes コントローラーのログと Webhook の構成で、より具体的なエラー メッセージを確認してください。

コンテナー化されたバックアップ ベースのエラー

これらのエラー コードは、AKS バックアップを有効にしてバックアップをコンテナー標準データストアに保存しているときに表示される可能性があります。

DppUserErrorVaultTierPolicyNotSupported

原因: このエラー コードは、バックアップ コンテナー用のコンテナー標準データストアに対して、保持ルールが定義されたバックアップ ポリシーが、このデータストアがサポートされていないリージョン内に作成されている場合に表示されます。

推奨されるアクション: Azure portal でコンテナー標準期間の定義有りで保持ルールを更新します。

  1. ルールの横にある [編集] アイコンを選択します。

    AKS バックアップの保持期間を編集する方法を示すスクリーンショット。

  2. [コンテナー標準] の横にあるチェックボックスを解除した後、[更新] を選択します。

    vault-standard チェックボックスをオフにしているスクリーンショット。

  3. 運用レベル バックアップ用のバックアップ ポリシーを作成します (AKS クラスターのスナップショットのみ)。

AKS のバックアップ ジョブと復元ジョブの完了時に警告が表示される

ポリシーによりPVスナップショットが許可されていないユーザーエラー

エラー コード: UserErrorPVSnapshotDisallowedByPolicy

原因: CSI ドライバーがボリューム スナップショットを取得できないようにする Azure ポリシーがサブスクリプションに対して割り当てられています。

推奨されるアクション: ディスク スナップショット操作できないようにする Azure ポリシーを削除した後、オンデマンド バックアップを実行する。

ユーザーエラー: PVスナップショットの上限に達しました

エラー コード: UserErrorPVSnapshotLimitReached

原因: ある時点で存在できる永続ボリュームのスナップショットの数は限られています。 Azure ディスクベースの永続ボリュームの場合、この制限は "500 個のスナップショット" です。 このエラーは、サポートされている制限を超えるスナップショットが存在することになるため、特定の永続ボリュームのスナップショットが作成されない場合に表示されます。

推奨されるアクション: バックアップ ポリシーを更新して保持期間を短縮し、Backup ボールトが以前の回復ポイントを削除するまで待ちます。

CSISnapshottingTimedOut

エラー コード: CSISnapshottingTimedOut

原因: CSI ドライバーがスナップショット ハンドルをフェッチする際にタイムアウトが発生しているためスナップショットが失敗しました。

推奨されるアクション: ログを確認し、オンデマンド バックアップを実行するか、次のスケジュールされたバックアップを待つことで、操作を再試行して正常なスナップショットを取得します。

ユーザーエラーフック実行失敗

エラー コード: UserErrorHookExecutionFailed

原因: バックアップと復元と共に実行するために適用されたフックでエラーが発生し、フックが正常に適用されていません。

推奨されるアクション: ログを確認し、フックを更新してから、バックアップ/復元操作を再試行します。

ユーザーエラー: 名前空間が見つかりません

エラー コード: UserErrorNamespaceNotFound

原因: バックアップ構成で指定された名前空間が、バックアップの実行時に見つかりません。 名前空間が誤って指定されたか、削除されています。

推奨されるアクション: バックアップする名前空間が正しく提供されているかどうかを確認します。

UserErrorPVCHasNoVolume

エラー コード: UserErrorPVCHasNoVolume

原因: コンテキスト内の永続ボリューム要求 (PVC) に永続ボリュームがアタッチされていません。 そのため、PVC はバックアップされません。

推奨されるアクション: バックアップする必要がある場合は、PVC にボリュームをアタッチします。

UserErrorPVCNotBoundToVolume

エラー コード: UserErrorPVCNotBoundToVolume

原因: コンテキスト内の PVC は "保留中" の状態であり、永続ボリュームがアタッチされていません。 そのため、PVC はバックアップされません。

推奨されるアクション: バックアップする必要がある場合は、PVC にボリュームをアタッチします。

UserErrorPVNotFound

エラー コード: UserErrorPVNotFound

原因: 永続ボリュームの基になるストレージ メディアが見つかりません。

推奨されるアクション: 実際のストレージ メディアがアタッチされた新しい永続ボリュームを確認してアタッチします。

ユーザーエラー:PVCのストレージクラスが見つかりません

エラー コード: UserErrorStorageClassMissingForPVC

原因: AKS バックアップが、使用されているストレージ クラスをチェックし、そのクラスが使用できないため、永続ボリュームのスナップショットの取得をスキップしています。

推奨されるアクション: 使用できるストレージ・クラスを使用して PVC 仕様を更新します。

ユーザーエラー: ソースとターゲットのクラスターCRDバージョンの不一致

エラー コード: UserErrorSourceandTargetClusterCRDVersionMismatch

原因: 復元中のソース AKS クラスターとターゲット AKS クラスターの FlowSchemaPriorityLevelConfigurations CRs のバージョンが異なります。 クラスターのバージョンが一致しないため、一部の Kubernetes リソースが復元されません。

推奨されるアクション: ターゲット クラスターに対してソース クラスターと同じクラスター バージョンを使用するか、手動で CR を適用します。

リンクされた認証が失敗しました

エラー コード: LinkedAuthorizationFailed

原因: 復元操作を実行するには、バックアップされた AKS クラスターに対する 読み取り アクセス許可がユーザーに必要です。

推奨されるアクション: ソース AKS クラスターに対する閲覧者ロールを割り当ててから、復元操作の実行に進んでください。

次のステップ