AksWebservice クラス
Azure Kubernetes Service 上の Web サービス エンドポイントとしてデプロイされた機械学習モデルを表します。
デプロイされたサービスは、モデル、スクリプト、および関連ファイルから作成されます。 結果として得られる Web サービスは、REST API を使用して負荷分散された HTTP エンドポイントです。 この API にデータを送信し、モデルによって返された予測を受け取ることができます。
AksWebservice は、1 つのサービスを 1 つのエンドポイントにデプロイします。 複数のサービスを 1 つのエンドポイントにデプロイするには、 AksEndpoint クラスを使用します。
詳細については、「 Azure Kubernetes Service クラスターへのモデルのデプロイ」を参照してください。
Web サービス インスタンスを初期化します。
Web サービス コンストラクターは、指定されたワークスペースに関連付けられている Web サービス オブジェクトのクラウド表現を取得します。 取得した Web サービス オブジェクトの特定の型に対応する子クラスのインスタンスが返されます。
コンストラクター
AksWebservice(workspace, name)
パラメーター
名前 | 説明 |
---|---|
workspace
必須
|
取得する Web サービス オブジェクトを含むワークスペース オブジェクト。 |
name
必須
|
取得する Web サービス オブジェクトの名前。 |
注釈
推奨されるデプロイ パターンは、deploy_configuration
メソッドを使用してデプロイ構成オブジェクトを作成し、次に示すように、deploy
クラスのModel メソッドでそれを使用することです。
# Set the web service configuration (using default here)
aks_config = AksWebservice.deploy_configuration()
# # Enable token auth and disable (key) auth on the webservice
# aks_config = AksWebservice.deploy_configuration(token_auth_enabled=True, auth_enabled=False)
Web サービスとしてモデルをデプロイするには、次のようなさまざまな方法があります。
deploy
ワークスペースに既に登録されているモデルの Model のメソッド。deploy_from_image
Webserviceのメソッド。deploy_from_model
ワークスペースに既に登録されているモデルの Webservice メソッド。 このメソッドはイメージを作成します。deploy
モデルを登録してイメージを作成する Webserviceのメソッド。
Web サービスの操作については、以下を参照してください。
[変数] セクションには、クラウド AksWebservice オブジェクトのローカル表現の属性が一覧表示されます。 これらの変数は読み取り専用と見なす必要があります。 値の変更は、対応するクラウド オブジェクトには反映されません。
変数
名前 | 説明 |
---|---|
enable_app_insights
|
Web サービスに対して AppInsights ログが有効かどうか。 |
autoscaler
|
Web サービスの Autoscaler オブジェクト。 |
compute_name
|
Web サービスがデプロイされる ComputeTarget の名前。 |
container_resource_requirements
|
Web サービスのコンテナー リソース要件。 |
liveness_probe_requirements
|
Web サービスのライブネス プローブの要件。 |
data_collection
|
Web サービスの DataCollection オブジェクト。 |
max_concurrent_requests_per_container
|
Web サービスのコンテナーあたりの同時要求の最大数。 |
max_request_wait_time
|
Web サービスの最大要求待機時間 (ミリ秒単位)。 |
num_replicas
|
Web サービスのレプリカの数。 各レプリカは AKS ポッドに対応します。 |
scoring_timeout_ms
|
Web サービスのスコアリング タイムアウト (ミリ秒単位)。 |
azureml.core.webservice.AksWebservice.scoring_uri
|
Web サービスのスコアリング エンドポイント |
is_default
|
Web サービスが親 AksEndpoint の既定のバージョンである場合。 |
traffic_percentile
|
親 AksEndpoint の Web サービスにルーティングするトラフィックの割合。 |
version_type
|
親 AksEndpoint の Web サービスのバージョンの種類。 |
token_auth_enabled
|
トークン認証が Web サービスに対して有効になっているかどうか。 |
environment
|
Web サービスの作成に使用された Environment オブジェクト。 |
azureml.core.webservice.AksWebservice.models
|
Web サービスにデプロイされたモデルの一覧。 |
deployment_status
|
Web サービスの展開状態。 |
namespace
|
Web サービスの AKS 名前空間。 |
azureml.core.webservice.AksWebservice.swagger_uri
|
Web サービスの swagger エンドポイント。 |
メソッド
add_properties |
この Web サービスのプロパティ ディクショナリにキー値ペアを追加します。 |
add_tags |
この Web サービスのタグ ディクショナリにキー値ペアを追加します。 WebserviceExceptionを発生させます。 |
deploy_configuration |
AKS コンピューティング ターゲットにデプロイするための構成オブジェクトを作成します。 |
get_access_token |
この Web サービスの認証トークンを取得します。 |
get_token |
廃止。 代わりに この Web サービスの認証トークンを取得します。 |
remove_tags |
この Web サービスのタグディクショナリから、指定したキーを削除します。 |
run |
指定された入力でこの Web サービスを呼び出します。 |
serialize |
この Web サービスを JSON シリアル化ディクショナリに変換します。 |
update |
指定されたプロパティを使用して Web サービスを更新します。 [なし] のままにした値は、この Web サービスでは変更されません。 |
add_properties
add_tags
この Web サービスのタグ ディクショナリにキー値ペアを追加します。
WebserviceExceptionを発生させます。
add_tags(tags)
パラメーター
名前 | 説明 |
---|---|
tags
必須
|
追加するタグのディクショナリ。 |
例外
型 | 説明 |
---|---|
deploy_configuration
AKS コンピューティング ターゲットにデプロイするための構成オブジェクトを作成します。
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None, blobfuse_enabled=None)
パラメーター
名前 | 説明 |
---|---|
autoscale_enabled
|
この Web サービスの自動スケールを有効にするかどうかを指定します。 num_replicasが None の場合、既定値は True になります。 規定値: None
|
autoscale_min_replicas
|
この Web サービスを自動スケールするときに使用するコンテナーの最小数。 既定値は 1 です。 規定値: None
|
autoscale_max_replicas
|
この Web サービスを自動スケールするときに使用するコンテナーの最大数。 既定値は 10 です。 規定値: None
|
autoscale_refresh_seconds
|
自動スケーラーがこの Web サービスのスケーリングを試みる頻度。 既定値は 1 です。 規定値: None
|
autoscale_target_utilization
|
自動スケーラーがこの Web サービスの維持を試みる必要があるターゲット使用率 (100% からパーセント)。 既定値は 70 です。 規定値: None
|
collect_model_data
|
この Web サービスのモデル データ収集を有効にするかどうかを指定します。 既定値は False です。 規定値: None
|
auth_enabled
|
この Web サービスのキー認証を有効にするかどうかを指定します。 既定値は True です。 規定値: None
|
cpu_cores
|
この Web サービスに割り当てる CPU コアの数。 10 進数を指定できます。 既定値は 0.1 です。 Azure Kubernetes Service の制限ではなく、ポッド コア要求に対応します。 規定値: None
|
memory_gb
|
この Web サービスに割り当てるメモリの量 (GB 単位)。 10 進数を指定できます。 既定値は 0.5 です。 Azure Kubernetes Service の制限ではなく、ポッド メモリ要求に対応します。 規定値: None
|
enable_app_insights
|
この Web サービスの Application Insights ログを有効にするかどうかを指定します。 既定値は False です。 規定値: None
|
scoring_timeout_ms
|
この Web サービスへの呼び出しのスコア付けに適用するタイムアウト。 既定値は 60000 です。 規定値: None
|
replica_max_concurrent_requests
|
この Web サービスに対して許可するレプリカあたりの同時要求の最大数。 既定値は 1 です。 Microsoft テクニカル サポートまたは Azure Machine Learning チームのメンバーから指示がない限り、この設定を既定値の 1 から変更しないでください。 規定値: None
|
max_request_wait_time
|
503 エラーを返す前に、要求がキューに保持される最大時間 (ミリ秒単位)。 既定値は 500 です。 規定値: None
|
num_replicas
|
この Web サービスに割り当てるコンテナーの数。 既定値はありません。このパラメーターが設定されていない場合、自動スケーラーは既定で有効になります。 規定値: None
|
primary_key
|
この Web サービスに使用するプライマリ認証キー。 規定値: None
|
secondary_key
|
この Web サービスに使用するセカンダリ認証キー。 規定値: None
|
tags
|
この Web サービスを提供するキー値タグのディクショナリ。 規定値: None
|
properties
|
この Web サービスを提供するキー値プロパティのディクショナリ。 これらのプロパティはデプロイ後に変更できませんが、新しいキーと値のペアを追加できます。 規定値: None
|
description
|
この Web サービスを指定する説明。 規定値: None
|
gpu_cores
|
この Web サービスに割り当てる GPU コアの数。 既定値は 0 です。 規定値: None
|
period_seconds
|
liveness probe を実行する頻度 (秒単位)。 既定値は 10 秒です。 最小値は 1 です。 規定値: None
|
initial_delay_seconds
|
コンテナーが起動してからライブネス プローブが開始されるまでの秒数。 既定値は 310 です。 規定値: None
|
timeout_seconds
|
ライブネス プローブがタイムアウトする秒数。既定値は 2 秒です。 最小値は 1 です。 規定値: None
|
success_threshold
|
失敗した後に成功したと見なされるライブネス プローブの最小連続成功数。 既定値は 1 です。 最小値は 1 です。 規定値: None
|
failure_threshold
|
Pod が起動し、liveness probe が失敗したとき、Kubernetes では、failureThreshold 回数だけ試し、それからあきらめます。 既定値は 3 です。 最小値は 1 です。 規定値: None
|
namespace
|
この Web サービスをデプロイする Kubernetes 名前空間:最大 63 文字の小文字 ('-'z'、'0'-'9')、ハイフン ('-') 文字。 先頭と末尾の文字をハイフンにすることはできません。 規定値: None
|
token_auth_enabled
|
この Web サービスのトークン認証を有効にするかどうかを指定します。 これが有効になっている場合、ユーザーは Azure Active Directory 資格情報を使用してアクセス トークンをフェッチすることで、この Web サービスにアクセスできます。 既定値は False です。 規定値: None
|
compute_target_name
|
デプロイ先のコンピューティング 先の名前 規定値: None
|
cpu_cores_limit
|
この Web サービスで使用できる CPU コアの最大数。 10 進数を指定できます。 規定値: None
|
memory_gb_limit
|
この Web サービスで使用できるメモリの最大量 (GB 単位)。 10 進数を指定できます。 規定値: None
|
blobfuse_enabled
|
この Web サービスのモデルのダウンロードで blobfuse を有効にするかどうかを指定します。 既定値は True 規定値: None
|
戻り値
型 | 説明 |
---|---|
AksWebservice をデプロイするときに使用する構成オブジェクト。 |
例外
型 | 説明 |
---|---|
get_access_token
この Web サービスの認証トークンを取得します。
get_access_token()
戻り値
型 | 説明 |
---|---|
この Web サービスの認証トークンを記述するオブジェクト。 |
例外
型 | 説明 |
---|---|
get_token
廃止。 代わりに get_access_token
メソッドを使用してください。
この Web サービスの認証トークンを取得します。
get_token()
戻り値
型 | 説明 |
---|---|
この Web サービスの認証トークンと、更新するタイミング。 |
例外
型 | 説明 |
---|---|
remove_tags
run
指定された入力でこの Web サービスを呼び出します。
run(input_data)
パラメーター
名前 | 説明 |
---|---|
input_data
必須
|
<xref:varies>
Web サービスを呼び出す入力 |
戻り値
型 | 説明 |
---|---|
Web サービスを呼び出した結果 |
例外
型 | 説明 |
---|---|
serialize
update
指定されたプロパティを使用して Web サービスを更新します。
[なし] のままにした値は、この Web サービスでは変更されません。
update(image=None, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, cpu_cores_limit=None, memory_gb_limit=None, **kwargs)
パラメーター
名前 | 説明 |
---|---|
image
|
Web サービスにデプロイする新しいイメージ 規定値: None
|
autoscale_enabled
|
この Web サービスの自動スケールを有効または無効にする 規定値: None
|
autoscale_min_replicas
|
この Web サービスを自動スケールするときに使用するコンテナーの最小数 規定値: None
|
autoscale_max_replicas
|
この Web サービスを自動スケールするときに使用するコンテナーの最大数 規定値: None
|
autoscale_refresh_seconds
|
自動スケーラーがこの Web サービスのスケーリングを試みる頻度 規定値: None
|
autoscale_target_utilization
|
自動スケーラーがこの Web サービスに対して維持を試みる必要があるターゲット使用率 (100%) 規定値: None
|
collect_model_data
|
この Web サービスのモデル データ収集を有効または無効にする 規定値: None
|
auth_enabled
|
この Web サービスの認証を有効にするかどうか 規定値: None
|
cpu_cores
|
この Web サービスに割り当てる CPU コアの数。 10 進数を指定できます。 規定値: None
|
memory_gb
|
この Web サービスに割り当てるメモリの量 (GB 単位)。 10 進数を指定できます。 規定値: None
|
enable_app_insights
|
この Web サービスに対して Application Insights ログを有効にするかどうかを指定します。 規定値: None
|
scoring_timeout_ms
|
この Web サービスへの呼び出しのスコア付けに適用するタイムアウト 規定値: None
|
replica_max_concurrent_requests
|
この Web サービスに対して許可するレプリカあたりの同時要求の最大数。 規定値: None
|
max_request_wait_time
|
503 エラーを返す前に、要求がキューに保持される最大時間 (ミリ秒単位) 規定値: None
|
num_replicas
|
この Web サービスに割り当てるコンテナーの数 規定値: None
|
tags
|
この Web サービスを提供するキー値タグのディクショナリ。 既存のタグを置き換えます。 規定値: None
|
properties
|
既存のプロパティ ディクショナリに追加するキー値プロパティのディクショナリ 規定値: None
|
description
|
この Web サービスを指定する説明 規定値: None
|
models
|
更新されたサービスでパッケージ化する Model オブジェクトの一覧 規定値: None
|
inference_config
|
必要なモデル デプロイ プロパティを提供するために使用される InferenceConfig オブジェクト。 規定値: None
|
gpu_cores
|
この Web サービスに割り当てる GPU コアの数 規定値: None
|
period_seconds
|
liveness probe を実行する頻度 (秒単位)。 既定値は 10 秒です。 最小値は 1 です。 規定値: None
|
initial_delay_seconds
|
コンテナーが起動してから、liveness プローブが開始されるまでの秒数。 規定値: None
|
timeout_seconds
|
ライブネス プローブがタイムアウトする秒数。既定値は 1 秒です。 最小値は 1 です。 規定値: None
|
success_threshold
|
失敗後、liveness probe が成功と見なされるための最小連続成功数。 既定値は 1 です。 最小値は 1 です。 規定値: None
|
failure_threshold
|
Pod が起動し、liveness probe が失敗したとき、Kubernetes では、failureThreshold 回数だけ試し、それからあきらめます。 既定値は 3 です。 最小値は 1 です。 規定値: None
|
namespace
|
この Web サービスをデプロイする Kubernetes 名前空間:最大 63 文字の小文字 ('-'z'、'0'-'9')、ハイフン ('-') 文字。 先頭と末尾の文字をハイフンにすることはできません。 規定値: None
|
token_auth_enabled
|
この Web サービスのトークン認証を有効にするかどうかを指定します。 これが有効になっている場合、ユーザーは Azure Active Directory 資格情報を使用してアクセス トークンをフェッチすることで、この Web サービスにアクセスできます。 既定値は False です 規定値: None
|
cpu_cores_limit
|
この Web サービスで使用できる CPU コアの最大数。 10 進数を指定できます。 規定値: None
|
memory_gb_limit
|
この Web サービスで使用できるメモリの最大量 (GB 単位)。 10 進数を指定できます。 規定値: None
|
kwargs
必須
|
<xref:varies>
には、AKS Web サービスの Kubernetes オンライン エンドポイントとデプロイへの移行をサポートするパラメーターが含まれています。 is_migration=True|False、compute_target= です。 |
例外
型 | 説明 |
---|---|