Compartir a través de


Exportación e importación de cuadernos de Databricks

En esta página se describe cómo importar y exportar cuadernos en Azure Databricks y los formatos de cuaderno que admite Azure Databricks.

Formatos de cuaderno admitidos

Databricks puede importar y exportar cuadernos en los siguientes formatos:

  • Archivo de código fuente: archivo que contiene solo instrucciones de código fuente con la extensión .scala, .py, .sql o .r.
  • HTML: cuaderno de Azure Databricks con la extensión .html.
  • Archivo .dbc de Databricks.
  • Cuaderno de IPython: cuaderno de Jupyter Notebook con la extensión .ipynb.
  • RMarkdown: documento R Markdown con la extensión .Rmd.

Importación de un cuaderno

Puede importar un cuaderno externo desde una dirección URL o un archivo. También puede importar un archivo ZIP de cuadernos exportados de forma masiva desde un área de trabajo de Azure Databricks.

  1. Haga clic en Workspace IconÁrea de trabajo en la barra lateral. Realice una de las siguientes acciones:
    • Haga clic con el botón derecho en una carpeta y seleccione Importar.
    • Para importar un cuaderno en el nivel superior de la carpeta del área de trabajo actual, haga clic en el menú de tres puntos de la esquina superior derecha y seleccione Importar.
  2. Especifique la dirección URL o busque un archivo que contenga un formato externo compatible o un archivo ZIP de cuadernos exportados desde un área de trabajo de Azure Databricks.
  3. Haga clic en Import.
    • Si solo elige un cuaderno, se exportará en la carpeta actual.
    • Si elige un archivo DBC o ZIP, se volverá a crear su estructura de carpetas en la carpeta actual y se importará cada cuaderno.

Conversión de un archivo en un cuaderno

Un recurso del área de trabajo se identifica como un cuaderno si tiene una .ipynb extensión o contiene la cadena Databricks notebook source en un comentario de la primera línea y tiene una de las siguientes extensiones: .py, .r, .scala, .sql. Cualquier escritura o cambio de nombre de un cuaderno o archivo que cambie estas condiciones, también cambia el tipo de cuaderno o archivo. Por ejemplo, si tienes un archivo myfile.txt que tiene # Databricks notebook source como la primera línea, renombrar ese archivo a myfile.py lo convierte en un cuaderno.

Nota:

La conversión entre tipos de archivo y cuaderno puede tener resultados inesperados, ya que los cuadernos tienen un formato IPYNB o de origen específico. Consulta Formatos de cuaderno.

Para convertir scripts de Python, SQL, Scala y R en cuadernos de una sola celda, agregue un comentario a la primera celda del archivo:

Pitón

# Databricks notebook source

SQL

-- Databricks notebook source

Scala

// Databricks notebook source

R

# Databricks notebook source

Para definir las celdas de un script, use el comentario especial que se muestra a continuación. Al importar el script a Databricks, las celdas se crean como marcadas por las líneas COMMAND mostradas.

Pitón

# COMMAND ----------

SQL

-- COMMAND ----------

Scala

// COMMAND ----------

R

# COMMAND ----------

Exportación de cuadernos

Nota:

Si se exporta un cuaderno como HTML, cuaderno de IPython (.ipynb) o archivo (DBC) y no se han borrado las salidas del comando, estas se incluyen en la exportación.

Para exportar un cuaderno, seleccione Archivo > Exportar en la barra de herramientas del cuaderno y seleccione el formato de exportación.

Para exportar todas las carpetas de una carpeta de área de trabajo como archivo ZIP:

  1. Haga clic en Workspace IconÁrea de trabajo en la barra lateral.

  2. Haga clic con el botón derecho en la carpeta y seleccione Exportar.

  3. Seleccione el formato de exportación:

    • Archivo DBC: exporta un archivo de Databricks, un formato binario que incluye metadatos y salidas del comando del cuaderno.
    • Archivo de origen: exporte un archivo ZIP de archivos de origen de cuadernos; se puede importar en un área de trabajo de Azure Databricks, utilizar en una canalización de CI/CD o visualizar como archivos de origen en el idioma predeterminado de cada cuaderno. No se incluyen las salidas del comando del cuaderno.
    • Archivo HTML: exporta un archivo ZIP de archivos HTML. El archivo HTML de cada cuaderno se puede importar en un área de trabajo de Azure Databricks o verse como HTML. Se incluyen las salidas del comando del cuaderno.