Compartir a través de


Grupo de comandos sync

Nota:

Esta información se aplica a las versiones 0.205 y posteriores de la CLI de Databricks. La CLI de Databricks está en versión preliminar pública.

El uso de la CLI de Databricks está sujeto a la licencia de Databricks y al aviso de privacidad de Databricks, incluidas las disposiciones de datos de uso.

El sync grupo de comandos de la CLI de Databricks permite la sincronización unidireccional de los cambios de código y archivos locales en un directorio de la máquina de desarrollo local en una carpeta del área de trabajo remota de Azure Databricks.

Nota:

  • sync los comandos no pueden sincronizar de vuelta los cambios de archivos de una carpeta ubicada en un área de trabajo remota de Azure Databricks hacia un directorio de su máquina de desarrollo local.
  • sync los comandos pueden sincronizar los cambios de archivo desde una máquina de desarrollo local solo a los archivos de usuario del área de trabajo (/Users) del área de trabajo de Azure Databricks. No se puede sincronizar con archivos DBFS (dbfs:/). Para sincronizar los cambios de archivo de una máquina de desarrollo local con DBFS (dbfs:/) en el área de trabajo de Azure Databricks, use la utilidad de sincronización dbx.

Ejecute los comandos sync anexándolos a databricks sync. A fin de mostrar la ayuda para este comando sync, ejecute databricks sync -h.

Sincronización incremental de los cambios de archivo local en un directorio remoto

Para realizar una sincronización unidireccional única e incremental de los cambios de archivo dentro de un directorio local en una carpeta de un área de trabajo remota de Azure Databricks, ejecute el comando de la sync siguiente manera:

databricks sync <local-directory-path> <remote-directory-path>

Por ejemplo, para realizar una sincronización incremental de un solo uso y de una sola dirección de todos los cambios de archivo desde la carpeta denominada my-local-folder en el directorio de trabajo actual local hacia la carpeta my-workspace-folder del área de trabajo remota, ejecute el siguiente comando:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder

En este ejemplo, solo los cambios de archivo desde la última ejecución del comando sync se sincronizan con /Users/someone@example.com/my-workspace-folder. De forma predeterminada, se utiliza la URL del área de trabajo del perfil del autor de la llamada DEFAULT para determinar el área de trabajo remota para sincronizarse.

Solo sincronizar archivos específicos

Para incluir o excluir archivos específicos para sincronizar en función de los patrones especificados, use las opciones --include, --include-from, --exclude o --exclude-from.

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore

Nota:

Si desea sincronizar archivos en un paquete, use la asignación de configuración sync en su lugar. Consulte sincronización.

Sincronización completa de los cambios de archivo local en un directorio remoto

Para realizar una sincronización única, completa y unidireccional de los cambios de archivo dentro de un directorio local en una carpeta de un área de trabajo remota de Azure Databricks, independientemente de cuándo se ejecutó el último sync comando, use la --full opción , por ejemplo:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full

Sincronizar continuamente los cambios de archivo local en un directorio remoto

Para activar la sincronización continua y unidireccional de los cambios de archivo dentro de un directorio local, en una carpeta de un área de trabajo remota de Azure Databricks, use la --watch opción , por ejemplo:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch

La sincronización unidireccional continúa hasta que el comando se detiene desde el terminal, normalmente presionando Ctrl + c o Ctrl + z.

El sondeo de posibles eventos de sincronización se produce una vez por segundo de forma predeterminada. Para cambiar este intervalo, use la opción --interval junto con el número de segundos que se van a sondear seguidos del carácter s, por ejemplo, durante cinco segundos:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s

Cambiar el formato de salida del progreso de sincronización

La información de progreso de sincronización se envía al terminal en formato de texto de forma predeterminada. Para especificar el formato de salida de progreso de sincronización, use la opción --output, especificando text (el valor predeterminado, si --output no se especifica de otro modo) o json, por ejemplo:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json

Vista previa de las operaciones de archivo para una sincronización

Para obtener una vista previa de una sincronización sin realizar realmente las operaciones de sincronización de archivos, use la --dry-run opción , por ejemplo:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete