次の方法で共有


AksServiceDeploymentConfiguration クラス

Azure Kubernetes Service にデプロイされたサービスのデプロイ構成情報を表します。

deploy_configuration クラスのAksWebservice メソッドを使用して、AksServiceDeploymentConfiguration オブジェクトを作成します。

AKS コンピューティング ターゲットにデプロイするための構成オブジェクトを初期化します。

コンストラクター

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

パラメーター

名前 説明
cpu_cores_limit
必須

この Web サービスで使用できる CPU コアの最大数。 10 進数を指定できます。

memory_gb_limit
必須

この Web サービスで使用できるメモリの最大量 (GB 単位)。 10 進数を指定できます。

autoscale_enabled
必須

この Web サービスの自動スケールを有効にするかどうかを示します。 num_replicasが None の場合、既定値は True です。

autoscale_min_replicas
必須
int

この Web サービスを自動スケールするときに使用するコンテナーの最小数。 既定値は 1 です。

autoscale_max_replicas
必須
int

この Web サービスを自動スケールするときに使用するコンテナーの最大数。 既定値は 10

autoscale_refresh_seconds
必須
int

自動スケーラーがこの Web サービスのスケーリングを試みる頻度。 既定値は 1 です。

autoscale_target_utilization
必須
int

自動スケーラーがこの Web サービスの維持を試みる必要があるターゲット使用率 (100% からパーセント)。 既定値は 70 です。

collect_model_data
必須

この Web サービスのモデル データ収集を有効にするかどうかを指定します。 既定値は False です。

auth_enabled
必須

この Web サービスの認証を有効にするかどうかを指定します。 既定値は True です。

cpu_cores
必須

この Web サービスに割り当てる CPU コアの数。 10 進数を指定できます。 既定値は 0.1

memory_gb
必須

この Web サービスに割り当てるメモリの量 (GB 単位)。 10 進数を指定できます。 既定値は 0.5

enable_app_insights
必須

この Web サービスの Application Insights ログを有効にするかどうかを指定します。 既定値は False です

scoring_timeout_ms
必須
int

この Web サービスへの呼び出しのスコア付けに適用するタイムアウト。 既定値は 60000 です。

replica_max_concurrent_requests
必須
int

この Web サービスに対して許可するレプリカあたりの同時要求の最大数。 既定値は 1 です。 Microsoft テクニカル サポートまたは Azure Machine Learning チームのメンバーから指示がない限り、この設定を既定値の 1 から変更しないでください。

max_request_wait_time
必須
int

503 エラーを返す前に、要求がキューに保持される最大時間 (ミリ秒単位)。 既定値は 500 です。

num_replicas
必須
int

この Web サービスに割り当てるコンテナーの数。 既定値はありません。このパラメーターが設定されていない場合、自動スケーラーは既定で有効になります。

primary_key
必須
str

この Web サービスに使用するプライマリ認証キー。

secondary_key
必須
str

この Web サービスに使用するセカンダリ認証キー。

tags
必須

この Web サービスを提供するキー値タグのディクショナリ。

properties
必須

この Web サービスを提供するキー値プロパティのディクショナリ。 これらのプロパティはデプロイ後に変更できませんが、新しいキーと値のペアを追加できます。

description
必須
str

この Web サービスを指定する説明。

gpu_cores
必須
int

この Web サービスに割り当てる GPU コアの数。 既定値は 0 です。

period_seconds
必須
int

liveness probe を実行する頻度 (秒単位)。 既定値は 10 秒です。 最小値は 1 です。

initial_delay_seconds
必須
int

コンテナーが起動してから、liveness プローブが開始されるまでの秒数。 既定値は 310 です。

timeout_seconds
必須
int

ライブネス プローブがタイムアウトする秒数。既定値は 2 秒です。 最小値は 1 です。

success_threshold
必須
int

失敗後、liveness probe が成功と見なされるための最小連続成功数。 既定値は 1 です。 最小値は 1 です。

failure_threshold
必須
int

ポッドが起動し、ライブネス プローブが失敗すると、Kubernetes は failureThreshold 時間試行してから、あきらめていきます。 既定値は 3 です。 最小値は 1 です。

namespace
必須
str

この Web サービスをデプロイする Kubernetes 名前空間:最大 63 文字の小文字 ('-'z'、'0'-'9')、ハイフン ('-') 文字。 先頭と末尾の文字をハイフンにすることはできません。

token_auth_enabled
必須

この Web サービスに対して Azure Active Directory 認証を有効にするかどうか。 これが有効になっている場合、ユーザーは Azure Active Directory 資格情報を使用してアクセス トークンをフェッチすることで、この Web サービスにアクセスできます。 既定値は False です。

cpu_cores_limit
必須

この Web サービスで使用できる CPU コアの最大数。 10 進数を指定できます。

memory_gb_limit
必須

この Web サービスで使用できるメモリの最大量 (GB 単位)。 10 進数を指定できます。

blobfuse_enabled

この Web サービスのモデルのダウンロードで blobfuse を有効にするかどうかを指定します。 既定値は True

規定値: None
autoscale_enabled
必須

この Web サービスの自動スケールを有効にするかどうかを示します。 num_replicasが None の場合、既定値は True です。

autoscale_min_replicas
必須
int

この Web サービスを自動スケールするときに使用するコンテナーの最小数。 既定値は 1 です。

autoscale_max_replicas
必須
int

この Web サービスを自動スケールするときに使用するコンテナーの最大数。 既定値は 10

autoscale_refresh_seconds
必須
int

自動スケーラーがこの Web サービスのスケーリングを試みる頻度。 既定値は 1 です。

autoscale_target_utilization
必須
int

自動スケーラーがこの Web サービスの維持を試みる必要があるターゲット使用率 (100% からパーセント)。 既定値は 70 です。

collect_model_data
必須

この Web サービスのモデル データ収集を有効にするかどうかを指定します。 既定値は False です。

auth_enabled
必須

この Web サービスの認証を有効にするかどうかを指定します。 既定値は True です。

cpu_cores
必須

この Web サービスに割り当てる CPU コアの数。 10 進数を指定できます。 既定値は 0.1

memory_gb
必須

この Web サービスに割り当てるメモリの量 (GB 単位)。 10 進数を指定できます。 既定値は 0.5

enable_app_insights
必須

この Web サービスの Application Insights ログを有効にするかどうかを指定します。 既定値は False です

scoring_timeout_ms
必須
int

この Web サービスへの呼び出しのスコア付けに適用するタイムアウト。 既定値は 60000 です。

replica_max_concurrent_requests
必須
int

この Web サービスに対して許可するレプリカあたりの同時要求の最大数。 既定値は 1 です。 Microsoft テクニカル サポートまたは Azure Machine Learning チームのメンバーから指示がない限り、この設定を既定値の 1 から変更しないでください。

max_request_wait_time
必須
int

503 エラーを返す前に、要求がキューに保持される最大時間 (ミリ秒単位)。 既定値は 500 です。

num_replicas
必須
int

この Web サービスに割り当てるコンテナーの数。 既定値はありません。このパラメーターが設定されていない場合、自動スケーラーは既定で有効になります。

primary_key
必須
str

この Web サービスに使用するプライマリ認証キー。

secondary_key
必須
str

この Web サービスに使用するセカンダリ認証キー。

tags
必須

この Web サービスを提供するキー値タグのディクショナリ。

properties
必須

この Web サービスを提供するキー値プロパティのディクショナリ。 これらのプロパティはデプロイ後に変更できませんが、新しいキーと値のペアを追加できます。

description
必須
str

この Web サービスを指定する説明。

gpu_cores
必須
int

この Web サービスに割り当てる GPU コアの数。 既定値は 0 です。

period_seconds
必須
int

liveness probe を実行する頻度 (秒単位)。 既定値は 10 秒です。 最小値は 1 です。

initial_delay_seconds
必須
int

コンテナーが起動してから、liveness プローブが開始されるまでの秒数。 既定値は 310 です。

timeout_seconds
必須
int

ライブネス プローブがタイムアウトする秒数。既定値は 2 秒です。 最小値は 1 です。

success_threshold
必須
int

失敗後、liveness probe が成功と見なされるための最小連続成功数。 既定値は 1 です。 最小値は 1 です。

failure_threshold
必須
int

ポッドが起動し、ライブネス プローブが失敗すると、Kubernetes は failureThreshold 時間試行してから、あきらめていきます。 既定値は 3 です。 最小値は 1 です。

namespace
必須
str

この Web サービスをデプロイする Kubernetes 名前空間:最大 63 文字の小文字 ('-'z'、'0'-'9')、ハイフン ('-') 文字。 先頭と末尾の文字をハイフンにすることはできません。

token_auth_enabled
必須

この Web サービスに対して Azure Active Directory 認証を有効にするかどうか。 これが有効になっている場合、ユーザーは Azure Active Directory 資格情報を使用してアクセス トークンをフェッチすることで、この Web サービスにアクセスできます。 既定値は False です。

compute_target_name
必須
str

デプロイ先のコンピューティング 先の名前

cpu_cores_limit
必須

この Web サービスで使用できる CPU コアの最大数。 10 進数を指定できます。

memory_gb_limit
必須

この Web サービスで使用できるメモリの最大量 (GB 単位)。 10 進数を指定できます。

blobfuse_enabled
必須

この Web サービスのモデルのダウンロードで blobfuse を有効にするかどうかを指定します。 既定値は True

変数

名前 説明
autoscale_enabled

この Web サービスの自動スケールを有効にするかどうかを示します。 num_replicasが None の場合、既定値は True です。

autoscale_min_replicas
int

この Web サービスを自動スケールするときに使用するコンテナーの最小数。 既定値は 1 です。

autoscale_max_replicas
int

この Web サービスを自動スケールするときに使用するコンテナーの最大数。 既定値は 10

autoscale_refresh_seconds
int

自動スケーラーがこの Web サービスのスケーリングを試みる頻度。 既定値は 1 です。

autoscale_target_utilization
int

自動スケーラーがこの Web サービスの維持を試みる必要があるターゲット使用率 (100% からパーセント)。 既定値は 70 です。

collect_model_data

この Web サービスのモデル データ収集を有効にするかどうかを指定します。 既定値は False です。

auth_enabled

この Web サービスの認証を有効にするかどうかを指定します。 既定値は True です。

cpu_cores

この Web サービスに割り当てる CPU コアの数。 10 進数を指定できます。 既定値は 0.1

memory_gb

この Web サービスに割り当てるメモリの量 (GB 単位)。 10 進数を指定できます。 既定値は 0.5

enable_app_insights

この Web サービスの Application Insights ログを有効にするかどうかを指定します。 既定値は False です

scoring_timeout_ms
int

この Web サービスへの呼び出しのスコア付けに適用するタイムアウト。 既定値は 60000 です。

replica_max_concurrent_requests
int

この Web サービスに対して許可するレプリカあたりの同時要求の最大数。 既定値は 1 です。 Microsoft テクニカル サポートまたは Azure Machine Learning チームのメンバーから指示がない限り、この設定を既定値の 1 から変更しないでください。

max_request_wait_time
int

503 エラーを返す前に、要求がキューに保持される最大時間 (ミリ秒単位)。 既定値は 500 です。

num_replicas
int

この Web サービスに割り当てるコンテナーの数。 既定値はありません。このパラメーターが設定されていない場合、自動スケーラーは既定で有効になります。

primary_key
str

この Web サービスに使用するプライマリ認証キー。

secondary_key
str

この Web サービスに使用するセカンダリ認証キー。

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

この Web サービスを提供するキー値タグのディクショナリ。

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

この Web サービスを提供するキー値プロパティのディクショナリ。 これらのプロパティはデプロイ後に変更できませんが、新しいキーと値のペアを追加できます。

azureml.core.webservice.AksServiceDeploymentConfiguration.description

この Web サービスを指定する説明。

gpu_cores
int

この Web サービスに割り当てる GPU コアの数。 既定値は 0 です。

period_seconds
int

liveness probe を実行する頻度 (秒単位)。 既定値は 10 秒です。 最小値は 1 です。

initial_delay_seconds
int

コンテナーが起動してから、liveness プローブが開始されるまでの秒数。 既定値は 310 です。

timeout_seconds
int

ライブネス プローブがタイムアウトする秒数。既定値は 2 秒です。 最小値は 1 です。

success_threshold
int

失敗後、liveness probe が成功と見なされるための最小連続成功数。 既定値は 1 です。 最小値は 1 です。

failure_threshold
int

ポッドが起動し、ライブネス プローブが失敗すると、Kubernetes は failureThreshold 時間試行してから、あきらめていきます。 既定値は 3 です。 最小値は 1 です。

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

この Web サービスをデプロイする Kubernetes 名前空間:最大 63 文字の小文字 ('-'z'、'0'-'9')、ハイフン ('-') 文字。 先頭と末尾の文字をハイフンにすることはできません。

token_auth_enabled

この Web サービスに対して Azure Active Directory 認証を有効にするかどうか。 これが有効になっている場合、ユーザーは Azure Active Directory 資格情報を使用してアクセス トークンをフェッチすることで、この Web サービスにアクセスできます。 既定値は False です。

メソッド

print_deploy_configuration

デプロイ構成を印刷します。

validate_configuration

指定した構成値が有効であることを確認します。

検証が失敗した場合、WebserviceException が発生します。

print_deploy_configuration

デプロイ構成を印刷します。

print_deploy_configuration()

validate_configuration

指定した構成値が有効であることを確認します。

検証が失敗した場合、WebserviceException が発生します。

validate_configuration()

例外

説明