Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Grupo de comandos
Nota:
Esta información se aplica a las versiones 0.205 y posteriores de la CLI de Databricks. La CLI de Databricks está en versión preliminar pública.
El uso de la CLI de Databricks está sujeto a la licencia de Databricks y al aviso de privacidad de Databricks, incluidas las disposiciones de datos de uso.
El sync
grupo de comandos de la CLI de Databricks permite la sincronización unidireccional de los cambios de código y archivos locales en un directorio de la máquina de desarrollo local en una carpeta del área de trabajo remota de Azure Databricks.
Nota:
-
sync
los comandos no pueden sincronizar de vuelta los cambios de archivos de una carpeta ubicada en un área de trabajo remota de Azure Databricks hacia un directorio de su máquina de desarrollo local. -
sync
los comandos pueden sincronizar los cambios de archivo desde una máquina de desarrollo local solo a los archivos de usuario del área de trabajo (/Users
) del área de trabajo de Azure Databricks. No se puede sincronizar con archivos DBFS (dbfs:/
). Para sincronizar los cambios de archivo de una máquina de desarrollo local con DBFS (dbfs:/
) en el área de trabajo de Azure Databricks, use la utilidad de sincronización dbx.
Ejecute los comandos sync
anexándolos a databricks sync
. A fin de mostrar la ayuda para este comando sync
, ejecute databricks sync -h
.
Sincronización incremental de los cambios de archivo local en un directorio remoto
Para realizar una sincronización unidireccional única e incremental de los cambios de archivo dentro de un directorio local en una carpeta de un área de trabajo remota de Azure Databricks, ejecute el comando de la sync
siguiente manera:
databricks sync <local-directory-path> <remote-directory-path>
Por ejemplo, para realizar una sincronización incremental de un solo uso y de una sola dirección de todos los cambios de archivo desde la carpeta denominada my-local-folder
en el directorio de trabajo actual local hacia la carpeta my-workspace-folder
del área de trabajo remota, ejecute el siguiente comando:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder
En este ejemplo, solo los cambios de archivo desde la última ejecución del comando sync
se sincronizan con /Users/someone@example.com/my-workspace-folder
. De forma predeterminada, se utiliza la URL del área de trabajo del perfil del autor de la llamada DEFAULT
para determinar el área de trabajo remota para sincronizarse.
Solo sincronizar archivos específicos
Para incluir o excluir archivos específicos para sincronizar en función de los patrones especificados, use las opciones --include
, --include-from
, --exclude
o --exclude-from
.
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore
Nota:
Si desea sincronizar archivos en un paquete, use la asignación de configuración sync
en su lugar. Consulte sincronización.
Sincronización completa de los cambios de archivo local en un directorio remoto
Para realizar una sincronización única, completa y unidireccional de los cambios de archivo dentro de un directorio local en una carpeta de un área de trabajo remota de Azure Databricks, independientemente de cuándo se ejecutó el último sync
comando, use la --full
opción , por ejemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full
Sincronizar continuamente los cambios de archivo local en un directorio remoto
Para activar la sincronización continua y unidireccional de los cambios de archivo dentro de un directorio local, en una carpeta de un área de trabajo remota de Azure Databricks, use la --watch
opción , por ejemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch
La sincronización unidireccional continúa hasta que el comando se detiene desde el terminal, normalmente presionando Ctrl + c
o Ctrl + z
.
El sondeo de posibles eventos de sincronización se produce una vez por segundo de forma predeterminada. Para cambiar este intervalo, use la opción --interval
junto con el número de segundos que se van a sondear seguidos del carácter s
, por ejemplo, durante cinco segundos:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s
Cambiar el formato de salida del progreso de sincronización
La información de progreso de sincronización se envía al terminal en formato de texto de forma predeterminada. Para especificar el formato de salida de progreso de sincronización, use la opción --output
, especificando text
(el valor predeterminado, si --output
no se especifica de otro modo) o json
, por ejemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json
Vista previa de las operaciones de archivo para una sincronización
Para obtener una vista previa de una sincronización sin realizar realmente las operaciones de sincronización de archivos, use la --dry-run
opción , por ejemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete