Compartir a través de


databricks_step Módulo

Contiene la funcionalidad para crear un paso de canalización de Azure ML para ejecutar un cuaderno de Databricks o un script de Python en DBFS.

Clases

DatabricksStep

Crea un paso de canalización de Azure ML para agregar un cuaderno de DataBricks, script de Python o JAR como nodo.

Para obtener un ejemplo de uso de DatabricksStep, consulte el cuaderno https://aka.ms/pl-databricks.

Cree un paso de canalización de Azure ML para agregar un cuaderno de DataBricks, script de Python o JAR como nodo.

Para obtener un ejemplo de uso de DatabricksStep, consulte el cuaderno https://aka.ms/pl-databricks.

:p aram python_script_name:[Obligatorio] Nombre de un script de Python relativo a source_directory. Si el script toma entradas y salidas, estos se pasarán al script como parámetros. Si python_script_name se especifica, source_directory debe ser también.

Especifique exactamente uno de notebook_path, python_script_path, python_script_nameo main_class_name.

Si especifica un objeto DataReference como entrada con data_reference_name=input1 y un objeto PipelineData como salida con name=output1, las entradas y salidas se pasarán al script como parámetros. Así es como se verán y tendrá que analizar los argumentos del script para acceder a las rutas de acceso de cada entrada y salida: "-input1","wasbs://test@storagename.blob.core.windows.net/test","-output1", "wasbs://test@storagename.blob.core.windows.net/b3e26de1-87a4-494d-a20f-1988d22b81a2/output1"

Además, los parámetros siguientes estarán disponibles en el script:

  • AZUREML_RUN_TOKEN: token de AML para autenticarse con Azure Machine Learning.
  • AZUREML_RUN_TOKEN_EXPIRY: hora de expiración del token de AML.
  • AZUREML_RUN_ID: Identificador de ejecución de Azure Machine Learning para esta ejecución.
  • AZUREML_ARM_SUBSCRIPTION: suscripción de Azure para el área de trabajo de AML.
  • AZUREML_ARM_RESOURCEGROUP: grupo de recursos de Azure para el área de trabajo de Azure Machine Learning.
  • AZUREML_ARM_WORKSPACE_NAME: nombre del área de trabajo de Azure Machine Learning.
  • AZUREML_ARM_PROJECT_NAME: nombre del experimento de Azure Machine Learning.
  • AZUREML_SERVICE_ENDPOINT: la dirección URL del punto de conexión para los servicios de AML.
  • AZUREML_WORKSPACE_ID: identificador del área de trabajo de Azure Machine Learning.
  • AZUREML_EXPERIMENT_ID: identificador del experimento de Azure Machine Learning.
  • AZUREML_SCRIPT_DIRECTORY_NAME: ruta de acceso del directorio en DBFS donde se ha copiado source_directory.
  (This parameter is only populated when `python_script_name` is used.  See more details below.)

Al ejecutar un script de Python desde la máquina local en Databricks mediante parámetros source_directory databricksStep y python_script_name, el source_directory se copia en DBFS y la ruta de acceso del directorio en DBFS se pasa como parámetro al script cuando comienza la ejecución. Este parámetro se etiqueta como –AZUREML_SCRIPT_DIRECTORY_NAME. Debe prefijarlo con la cadena "dbfs:/" o "/dbfs/" para acceder al directorio en DBFS.