Compartir a través de


Inicio rápido: Creación de un nuevo grupo de Apache Spark sin servidor mediante Azure Portal

Azure Synapse Analytics ofrece varios motores de análisis para ayudarle a ingerir, transformar, modelar, analizar y distribuir los datos. Un grupo de Apache Spark proporciona funcionalidades de proceso de macrodatos de código abierto. Después de crear un grupo de Apache Spark en el área de trabajo de Synapse, los datos se pueden cargar, modelar, procesar y distribuir para obtener información analítica más rápida.

En este inicio rápido, aprenderá a usar Azure Portal para crear un grupo de Apache Spark en un área de trabajo de Synapse.

Importante

La facturación de las instancias de Spark se prorratea por minuto, tanto si se usan como si no. Asegúrese de cerrar la instancia de Spark después de que haya terminado de usarla, o configure un breve tiempo de espera. Para obtener más información, consulte la sección Limpieza de recursos de este artículo.

Si no tiene una suscripción a Azure, cree una cuenta gratuita antes de empezar.

Prerrequisitos

Inicio de sesión en Azure Portal

Inicie sesión en el Portal de Azure

  1. Vaya al área de trabajo de Synapse en la que se va a crear el grupo de Apache Spark. Para ello, escriba el nombre del servicio (o el nombre del recurso directamente) en la barra de búsqueda. Captura de pantalla de la barra de búsqueda de Azure Portal con áreas de trabajo de Synapse tipadas.

  2. En la lista de áreas de trabajo, escriba el nombre (o una parte del nombre) del área que desea abrir. En este ejemplo, se usa un área de trabajo denominado contosoanalytics. Captura de Azure Portal de la lista de las áreas de trabajo de Synapse filtradas para que se muestren las que contienen el nombre Contoso.

Creación de un nuevo grupo de Apache Spark

  1. En el área de trabajo de Synapse donde desea crear el grupo de Apache Spark, seleccione Nuevo grupo de Apache Spark. Captura de pantalla de Azure Portal de un área de trabajo de Synapse con un cuadro rojo alrededor del comando para crear un nuevo grupo de Apache Spark.

  2. Escriba la siguiente información en la pestaña Datos básicos.

    Configuración Valor sugerido Descripción
    Nombre del grupo de Apache Spark Un nombre de grupo válido, como contosospark Este es el nombre que tendrá el grupo de Apache Spark.
    Tamaño del nodo Pequeño (4 vCPU/32 GB) Establézcalo en el tamaño más pequeño para reducir los costos de este inicio rápido
    Escalado automático Deshabilitado No es necesario el escalado automático para este inicio rápido
    Número de nodos 5 Uso de un tamaño pequeño para limitar los costos de este inicio rápido

    Captura de pantalla de Azure Portal del flujo de creación del grupo de Apache Spark: aspectos básicos.

    Importante

    Existen limitaciones específicas para los nombres que pueden usar los grupos de Apache Spark. Los nombres solo deben contener letras o números, deben tener 15 caracteres o menos, deben comenzar con una letra, no contener palabras reservadas y ser únicos en el área de trabajo.

  3. Seleccione Siguiente: configuración adicional y revise la configuración predeterminada. No modifique ninguna configuración predeterminada. Captura de pantalla de Azure Portal que muestra la página

  4. Seleccione Siguiente: etiquetas. Considere la posibilidad de usar las etiquetas de Azure. Por ejemplo, la etiqueta "Propietario" o "CreatedBy" para identificar quién creó el recurso y la etiqueta "Entorno" para identificar si este recurso está en Producción, Desarrollo, etc. Para más información, consulte Desarrollo de la estrategia de nomenclatura y etiquetado de los recursos de Azure. Captura de pantalla de Azure Portal del flujo de creación del grupo de Apache Spark: pestaña configuración adicional.

  5. Selecciona Revisar + crear.

  6. Asegúrese de que los detalles son correctos en función de lo que se especificó anteriormente y seleccione Crear. Captura de pantalla de Azure Portal del flujo de creación del grupo de Apache Spark: pestaña de configuración de revisión.

  7. En este momento, se iniciará el flujo de aprovisionamiento de recursos, lo que indica una vez completado. Captura de pantalla de Azure Portal de que muestra la página

  8. Una vez completado el aprovisionamiento, al volver al área de trabajo se mostrará una nueva entrada para el grupo de Apache Spark recién creado. Captura de pantalla de Azure Portal del flujo de creación del grupo de Apache Spark: aprovisionamiento de recursos.

  9. En este momento, no hay recursos en ejecución, ningún cargo por Spark, ha creado metadatos sobre las instancias de Spark que desea crear.

Limpieza de recursos

En los pasos siguientes se elimina el grupo de Apache Spark del área de trabajo.

Advertencia

Al eliminar un grupo de Apache Spark, se quitará el motor de análisis del área de trabajo. Ya no será posible conectarse al grupo, y todas las consultas, canalizaciones y cuadernos que usan este grupo de Apache Spark ya no funcionarán.

Si está seguro de que quiere eliminar el grupo de Apache Spark, siga estos pasos:

  1. Vaya al panel Grupos de Apache Spark en el área de trabajo.
  2. Seleccione el grupo de Apache Spark que se va a eliminar (en este caso, contosospark).
  3. Seleccione Eliminar. Captura de pantalla de Azure Portal de una lista de grupos de Apache Spark, con el grupo creado recientemente seleccionado.
  4. Confirme la eliminación y seleccione el botón Eliminar . Captura de pantalla de Azure Portal del cuadro de diálogo confirmación para eliminar el grupo de Apache Spark seleccionado.
  5. Cuando el proceso se complete correctamente, el grupo de Apache Spark dejará de aparecer en los recursos del área de trabajo.