次の方法で共有


コレクター レプリカ セットの水平ポッド自動スケーリング (HPA)

概要

Azure Managed Prometheus では、既定で ama-metrics レプリカ セット ポッドに対してポッドの水平自動スケーリング (HPA) がサポートされています。 HPA を使用すると、カスタム ジョブで Prometheus メトリックをスクレイピングする ama-metrics レプリカ セット ポッドが、メモリ使用率に基づいて自動的にスケーリングされ、OOMKills を防ぐことができます。 既定では、HPA は少なくとも 2 つのレプリカと最大 12 個のレプリカで構成されます。 ユーザーは、2 ~ 12 個のレプリカの範囲内のシャード数を構成できます。

HPA の Kubernetes サポート

最小および最大シャードを更新する

kube-system 名前空間の ama-metrics-hpa という名前の HPA オブジェクトを編集して、最小および最大シャード/レプリカ セット インスタンスを更新できます。 変更がサポートされている 2 から 12 の範囲内にない場合、それらは無効となり、最後の正常な状態に戻ります。

最小レプリカの更新

kubectl patch hpa ama-metrics-hpa -n kube-system --type merge --patch '{"spec": {"minReplicas": 4}}'

最大レプリカ数の更新

kubectl patch hpa ama-metrics-hpa -n kube-system --type merge --patch '{"spec": {"maxReplicas": 10}}'

最小レプリカと最大レプリカの更新

kubectl patch hpa ama-metrics-hpa -n kube-system --type merge --patch '{"spec": {"minReplicas": 3, "maxReplicas": 10}}'

または

最小レプリカと最大レプリカは、 kubectl 編集を実行し、エディターでスペックを更新することによっても編集できます。

kubectl edit hpa ama-metrics-hpa -n kube-system

HPA スケーリングを無効にするように最小シャードと最大シャードを更新する

既定の HPA 設定が顧客の要件を満たしていない場合は、シャードの最小数と最大数を同じに構成できます。 これにより、HPA がさまざまな負荷に基づいてレプリカをスケーリングするのを防ぎ、一貫した数のレプリカが確保されます。

例 - 顧客がシャードを 8 に設定し、HPA でシャードを更新しない場合は、最小シャードと最大シャード数を 8 に更新します。

最小レプリカと最大レプリカの更新

kubectl patch hpa ama-metrics-hpa -n kube-system --type merge --patch '{"spec": {"minReplicas": 8, "maxReplicas": 8}}'

ama-metrics-hpa 仕様の kubectl 編集では、HPA に使用されるスケールアップとスケールダウンの構成に関する詳細情報が提供されます

次のステップ