Compartir a través de


steps Paquete

Contiene pasos precompilados que se pueden ejecutar en una canalización de Azure Machine Learning.

Los pasos de canalización de Azure ML se pueden configurar juntos para construir una canalización, que representa un flujo de trabajo de Azure Machine Learning que se puede compartir y reutilizable. Cada paso de una canalización se puede configurar para permitir la reutilización de sus resultados de ejecución anteriores si el contenido del paso (scripts y dependencias), así como las entradas y los parámetros permanecen sin cambios.

Las clases de este paquete se suelen usar junto con las clases del core paquete. El paquete principal contiene clases para configurar datos (PipelineData), programar (Schedule) y administrar la salida de los pasos (StepRun).

Los pasos pregenerados de este paquete abarcan muchos escenarios comunes encontrados en los flujos de trabajo de aprendizaje automático. Para empezar a trabajar con los pasos de canalización pregeneradas, consulte:

Módulos

adla_step

Contiene la funcionalidad para crear un paso de canalización de Azure ML para ejecutar un script de U-SQL con Azure Data Lake Analytics.

automl_step

Contiene funcionalidad para agregar y administrar un paso de canalización de ML automatizado en Azure Machine Learning.

azurebatch_step

Contiene la funcionalidad para crear un paso de canalización de Azure ML que ejecuta un ejecutable de Windows en Azure Batch.

command_step

Contiene la funcionalidad para crear un paso de canalización de Azure ML que ejecuta comandos.

data_transfer_step

Contiene la funcionalidad para crear un paso de canalización de Azure ML que transfiere datos entre opciones de almacenamiento.

databricks_step

Contiene la funcionalidad para crear un paso de canalización de Azure ML para ejecutar un cuaderno de Databricks o un script de Python en DBFS.

estimator_step

Contiene la funcionalidad para crear un paso de canalización que ejecuta un estimador para el entrenamiento del modelo de Machine Learning.

hyper_drive_step

Contiene la funtionalidad para crear y administrar pasos de canalización de Azure ML que ejecutan el ajuste de hiperparámetros.

kusto_step

Contiene la funcionalidad para crear un paso de canalización de Azure ML para ejecutar un cuaderno de Kusto.

module_step

Contiene la funcionalidad para agregar un paso de canalización de Azure Machine Learning mediante una versión existente de un módulo.

mpi_step

Contiene la funcionalidad para agregar un paso de canalización de Azure ML para ejecutar un trabajo de MPI para el entrenamiento del modelo de Machine Learning.

parallel_run_config

Contiene la funcionalidad para configurar un ParallelRunStep.

parallel_run_step

Contiene la funcionalidad para agregar un paso para ejecutar el script de usuario en modo paralelo en varios destinos AmlCompute.

python_script_step

Contiene la funcionalidad para crear un paso de canalización de Azure ML que ejecuta el script de Python.

r_script_step

Contiene la funcionalidad para crear un paso de canalización de Azure ML que ejecuta el script de R.

synapse_spark_step

Contiene la funcionalidad para crear un paso de Synapse de Azure ML que ejecuta el script de Python.

Clases

AdlaStep

Crea un paso de canalización de Azure ML para ejecutar un script U-SQL con Azure Data Lake Analytics.

Para obtener un ejemplo de uso de este AdlaStep, consulte el cuaderno https://aka.ms/pl-adla.

Cree un paso de canalización de Azure ML para ejecutar un script de U-SQL con Azure Data Lake Analytics.

AutoMLStep

Crea un paso de canalización de Azure ML que encapsula una ejecución de ML automatizada.

Para obtener un ejemplo de uso de AutoMLStep, consulte el cuaderno https://aka.ms/pl-automl.

Inicialice un AutoMLStep.

AutoMLStepRun

Proporciona información sobre una ejecución y métodos automatizados de experimentos de ML para recuperar salidas predeterminadas.

La clase AutoMLStepRun se usa para administrar, comprobar el estado y recuperar los detalles de ejecución una vez que se envía una ejecución de ML automatizada en una canalización. Además, esta clase se puede usar para obtener las salidas predeterminadas de a través de AutoMLStep la StepRun clase .

Inicialice una ejecución de paso de automl.

AzureBatchStep

Crea un paso de canalización de Azure ML para enviar trabajos a Azure Batch.

Nota: Este paso no admite la carga o descarga de directorios y su contenido.

Para obtener un ejemplo de uso de AzureBatchStep, consulte el cuaderno https://aka.ms/pl-azbatch.

Cree un paso de canalización de Azure ML para enviar trabajos a Azure Batch.

CommandStep

Cree un paso de canalización de Azure ML que ejecute un comando.

Cree un paso de canalización de Azure ML que ejecute un comando.

DataTransferStep

Crea un paso de canalización de Azure ML que transfiere datos entre opciones de almacenamiento.

DataTransferStep admite tipos de almacenamiento comunes, como Azure Blob Storage y Azure Data Lake como orígenes y receptores. Para obtener más información, vea la sección Comentarios .

Para obtener un ejemplo de uso de DataTransferStep, consulte el cuaderno https://aka.ms/pl-data-trans.

Cree un paso de canalización de Azure ML que transfiera datos entre las opciones de almacenamiento.

DatabricksStep

Crea un paso de canalización de Azure ML para agregar un cuaderno de DataBricks, script de Python o JAR como nodo.

Para obtener un ejemplo de uso de DatabricksStep, consulte el cuaderno https://aka.ms/pl-databricks.

Cree un paso de canalización de Azure ML para agregar un cuaderno de DataBricks, script de Python o JAR como nodo.

Para obtener un ejemplo de uso de DatabricksStep, consulte el cuaderno https://aka.ms/pl-databricks.

:p aram python_script_name:[Obligatorio] Nombre de un script de Python relativo a source_directory. Si el script toma entradas y salidas, estos se pasarán al script como parámetros. Si python_script_name se especifica, source_directory debe ser también.

Especifique exactamente uno de notebook_path, python_script_path, python_script_nameo main_class_name.

Si especifica un objeto DataReference como entrada con data_reference_name=input1 y un objeto PipelineData como salida con name=output1, las entradas y salidas se pasarán al script como parámetros. Así es como se verán y tendrá que analizar los argumentos del script para acceder a las rutas de acceso de cada entrada y salida: "-input1","wasbs://test@storagename.blob.core.windows.net/test","-output1", "wasbs://test@storagename.blob.core.windows.net/b3e26de1-87a4-494d-a20f-1988d22b81a2/output1"

Además, los parámetros siguientes estarán disponibles en el script:

  • AZUREML_RUN_TOKEN: token de AML para autenticarse con Azure Machine Learning.
  • AZUREML_RUN_TOKEN_EXPIRY: hora de expiración del token de AML.
  • AZUREML_RUN_ID: Identificador de ejecución de Azure Machine Learning para esta ejecución.
  • AZUREML_ARM_SUBSCRIPTION: suscripción de Azure para el área de trabajo de AML.
  • AZUREML_ARM_RESOURCEGROUP: grupo de recursos de Azure para el área de trabajo de Azure Machine Learning.
  • AZUREML_ARM_WORKSPACE_NAME: nombre del área de trabajo de Azure Machine Learning.
  • AZUREML_ARM_PROJECT_NAME: nombre del experimento de Azure Machine Learning.
  • AZUREML_SERVICE_ENDPOINT: la dirección URL del punto de conexión para los servicios de AML.
  • AZUREML_WORKSPACE_ID: identificador del área de trabajo de Azure Machine Learning.
  • AZUREML_EXPERIMENT_ID: identificador del experimento de Azure Machine Learning.
  • AZUREML_SCRIPT_DIRECTORY_NAME: ruta de acceso del directorio en DBFS donde se ha copiado source_directory.
  (This parameter is only populated when `python_script_name` is used.  See more details below.)

Al ejecutar un script de Python desde la máquina local en Databricks mediante parámetros source_directory databricksStep y python_script_name, el source_directory se copia en DBFS y la ruta de acceso del directorio en DBFS se pasa como parámetro al script cuando comienza la ejecución. Este parámetro se etiqueta como –AZUREML_SCRIPT_DIRECTORY_NAME. Debe prefijarlo con la cadena "dbfs:/" o "/dbfs/" para acceder al directorio en DBFS.

EstimatorStep

OBSOLESCENTE. Crea un paso de canalización que se va a ejecutar para el Estimator entrenamiento del modelo de Azure ML.

Cree un paso de canalización de Azure ML para ejecutar el estimador para el entrenamiento del modelo de Machine Learning.

OBSOLESCENTE. Use en CommandStep su lugar. Para obtener un ejemplo, consulte Ejecución del entrenamiento de ML en canalizaciones con CommandStep.

HyperDriveStep

Crea un paso de canalización de Azure ML para ejecutar la asignación de hiperparámetros para el entrenamiento del modelo de Machine Learning.

Para obtener un ejemplo de uso de HyperDriveStep, vea el cuaderno https://aka.ms/pl-hyperdrive.

Cree un paso de canalización de Azure ML para ejecutar la asignación de hiperparámetros para el entrenamiento del modelo de Machine Learning.

HyperDriveStepRun

Administrar, comprobar el estado y recuperar los detalles de ejecución de un HyperDriveStep paso de canalización.

HyperDriveStepRun proporciona la funcionalidad de HyperDriveRun con la compatibilidad adicional de StepRun. La clase HyperDriveStepRun permite administrar, comprobar el estado y recuperar los detalles de ejecución de la ejecución de HyperDrive y cada una de sus ejecuciones secundarias generadas. La clase StepRun permite hacerlo una vez que se envía la ejecución de la canalización primaria y la canalización ha enviado la ejecución del paso.

Inicialice un HyperDriveStepRun.

HyperDriveStepRun proporciona la funcionalidad de HyperDriveRun con la compatibilidad adicional de StepRun. La clase HyperDriveRun permite administrar, comprobar el estado y recuperar los detalles de ejecución de la ejecución de HyperDrive y cada una de sus ejecuciones secundarias generadas. La clase StepRun permite hacerlo una vez que se envía la ejecución de la canalización primaria y la canalización ha enviado la ejecución del paso.

KustoStep

KustoStep permite la funcionalidad de ejecutar consultas de Kusto en un clúster de Kusto de destino en Azure ML Pipelines.

Inicialice KustoStep.

ModuleStep

Crea un paso de canalización de Azure Machine Learning para ejecutar una versión específica de un módulo.

Module los objetos definen cálculos reutilizables, como scripts o ejecutables, que se pueden usar en diferentes escenarios de aprendizaje automático y por distintos usuarios. Para usar una versión específica de un módulo en una canalización, cree un moduleStep. ModuleStep es un paso de la canalización que usa un existente ModuleVersion.

Para obtener un ejemplo de uso de ModuleStep, consulte el cuaderno https://aka.ms/pl-modulestep.

Cree un paso de canalización de Azure ML para ejecutar una versión específica de un módulo.

MpiStep

Crea un paso de canalización de Azure ML para ejecutar un trabajo de MPI.

Para obtener un ejemplo de uso de MpiStep, consulte el cuaderno https://aka.ms/pl-style-trans.

Cree un paso de canalización de Azure ML para ejecutar un trabajo de MPI.

OBSOLESCENTE. Use en CommandStep su lugar. Para obtener un ejemplo, consulte Ejecución del entrenamiento distribuido en canalizaciones con CommandStep.

ParallelRunConfig

Define la configuración de un ParallelRunStep objeto .

Para obtener un ejemplo de uso de ParallelRunStep, consulte el cuaderno https://aka.ms/batch-inference-notebooks.

Para obtener una guía de solución de problemas, consulte https://aka.ms/prstsg. Puede encontrar más referencias allí.

Inicialice el objeto config.

ParallelRunStep

Crea un paso de canalización de Azure Machine Learning para procesar grandes cantidades de datos de forma asincrónica y en paralelo.

Para obtener un ejemplo de uso de ParallelRunStep, consulte el cuaderno https://aka.ms/batch-inference-notebooks.

Para obtener una guía de solución de problemas, consulte https://aka.ms/prstsg. Puede encontrar más referencias allí.

Cree un paso de canalización de Azure ML para procesar grandes cantidades de datos de forma asincrónica y en paralelo.

Para obtener un ejemplo de uso de ParallelRunStep, consulte el vínculo https://aka.ms/batch-inference-notebooksdel cuaderno .

PythonScriptStep

Crea un paso de canalización de Azure ML que ejecuta el script de Python.

Para obtener un ejemplo de uso de PythonScriptStep, consulte el cuaderno https://aka.ms/pl-get-started.

Cree un paso de canalización de Azure ML que ejecute el script de Python.

RScriptStep

Nota:

Se trata de una clase experimental y puede cambiar en cualquier momento. Consulte https://aka.ms/azuremlexperimental para obtener más información.

Crea un paso de canalización de Azure ML que ejecuta el script de R.

Cree un paso de canalización de Azure ML que ejecute el script de R.

OBSOLESCENTE. Use en CommandStep su lugar. Para obtener un ejemplo, consulte Ejecución de scripts de R en canalizaciones con CommandStep.

SynapseSparkStep

Nota:

Se trata de una clase experimental y puede cambiar en cualquier momento. Consulte https://aka.ms/azuremlexperimental para obtener más información.

Crea un paso de Synapse de Azure ML que envía y ejecuta el script de Python.

Cree un paso de canalización de Azure ML que ejecute el trabajo de Spark en el grupo de Spark de Synapse.