概要
Azure Managed Prometheus では、既定で ama-metrics レプリカ セット ポッドに対してポッドの水平自動スケーリング (HPA) がサポートされています。 HPA を使用すると、カスタム ジョブで Prometheus メトリックをスクレイピングする ama-metrics レプリカ セット ポッドが、メモリ使用率に基づいて自動的にスケーリングされ、OOMKills を防ぐことができます。 既定では、HPA は少なくとも 2 つのレプリカと最大 12 個のレプリカで構成されます。 ユーザーは、2 ~ 12 個のレプリカの範囲内のシャード数を構成できます。
最小および最大シャードを更新する
kube-system 名前空間の ama-metrics-hpa という名前の HPA オブジェクトを編集して、最小および最大シャード/レプリカ セット インスタンスを更新できます。 変更がサポートされている 2 から 12 の範囲内にない場合、それらは無効となり、最後の正常な状態に戻ります。
最小レプリカの更新
kubectl patch hpa ama-metrics-hpa -n kube-system --type merge --patch '{"spec": {"minReplicas": 4}}'
最大レプリカ数の更新
kubectl patch hpa ama-metrics-hpa -n kube-system --type merge --patch '{"spec": {"maxReplicas": 10}}'
最小レプリカと最大レプリカの更新
kubectl patch hpa ama-metrics-hpa -n kube-system --type merge --patch '{"spec": {"minReplicas": 3, "maxReplicas": 10}}'
または
最小レプリカと最大レプリカは、 kubectl 編集を実行し、エディターでスペックを更新することによっても編集できます。
kubectl edit hpa ama-metrics-hpa -n kube-system
HPA スケーリングを無効にするように最小シャードと最大シャードを更新する
既定の HPA 設定が顧客の要件を満たしていない場合は、シャードの最小数と最大数を同じに構成できます。 これにより、HPA がさまざまな負荷に基づいてレプリカをスケーリングするのを防ぎ、一貫した数のレプリカが確保されます。
例 - 顧客がシャードを 8 に設定し、HPA でシャードを更新しない場合は、最小シャードと最大シャード数を 8 に更新します。
最小レプリカと最大レプリカの更新
kubectl patch hpa ama-metrics-hpa -n kube-system --type merge --patch '{"spec": {"minReplicas": 8, "maxReplicas": 8}}'
ama-metrics-hpa 仕様の kubectl 編集では、HPA に使用されるスケールアップとスケールダウンの構成に関する詳細情報が提供されます