Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Los datos usados con Power BI se almacenan en el almacenamiento interno proporcionado por Power BI de forma predeterminada. Con la integración de flujos de datos y Azure Data Lake Storage Gen2 (ADLS Gen2), puede almacenar los flujos de datos en la cuenta de Azure Data Lake Storage Gen2 de su organización. Esta característica básicamente le permite "traer su propio almacenamiento" a los flujos de datos de Power BI y establecer una conexión en el nivel de inquilino o área de trabajo.
Razones para usar el área de trabajo o la conexión de inquilino de ADLS Gen2
Después de adjuntar el flujo de datos, Power BI configura y guarda una referencia para que ahora pueda leer y escribir datos en su propia instancia de ADLS Gen 2. Power BI almacena los datos en el formato de modelo de datos común (CDM), que captura metadatos sobre los datos además de los datos reales generados por el propio flujo de datos. Esta característica desbloquea muchas funcionalidades eficaces y permite que los datos y los metadatos asociados en formato CDM ahora sirvan a escenarios de extensibilidad, automatización, supervisión y copia de seguridad. Al hacer que estos datos estén disponibles y accesibles ampliamente en su propio entorno, le permite democratizar la información y los datos creados en su organización. También desbloquea la capacidad de crear soluciones adicionales con una amplia gama de complejidad. Sus soluciones pueden ser aplicaciones y soluciones personalizadas compatibles con CDM en Power Platform, Azure y las disponibles a través de ecosistemas de socios y proveedores de software independientes (ISV). O bien, puede crear una aplicación para leer un CSV. Los ingenieros de datos, los científicos de datos y los analistas ahora pueden trabajar con, usar y reutilizar un conjunto común de datos que se mantiene en ADLS Gen 2.
Hay dos maneras de configurar el almacén de ADLS Gen 2 que se va a usar: puede usar una cuenta de ADLS Gen 2 asignada por el inquilino o puede traer su propio almacén de ADLS Gen 2 en un nivel de área de trabajo.
Prerrequisitos
Para traer su propia cuenta de ADLS Gen2, debe tener permisos de Propietario en la capa de la cuenta de almacenamiento. Los permisos en el nivel de grupo de recursos o suscripción no funcionarán. Si es administrador, sigue teniendo que asignarse a sí mismo permiso de propietario. Actualmente no admite cuentas de almacenamiento de ADLS Gen2 detrás de un firewall.
La cuenta de almacenamiento debe crearse con el espacio de nombres jerárquicos (HNS) habilitado.
La cuenta de almacenamiento debe crearse en el mismo inquilino de Microsoft Entra que el inquilino de Power BI.
El usuario debe tener el rol Propietario de datos de Storage Blob, el rol Lector de datos de Storage Blob y un rol propietario en el nivel de cuenta de almacenamiento (el ámbito debe ser este recurso y no heredado). Los cambios de rol aplicados pueden tardar unos minutos en sincronizarse y deben sincronizarse antes de que se puedan completar los pasos siguientes en el servicio Power BI.
En el caso de las áreas de trabajo de Pro, la cuenta de almacenamiento debe estar en la misma región que la región principal de Fabric. En el caso de las áreas de trabajo Premium, la cuenta de almacenamiento debe estar en la misma región que la capacidad premium.
Se requiere TLS (seguridad de la capa de transporte) versión 1.2 (o superior) para proteger los puntos de conexión. Los exploradores web y otras aplicaciones cliente que usan versiones de TLS anteriores a TLS 1.2 no podrán conectarse.
No se admite la asociación de un flujo de datos con ADLS Gen 2 detrás de la autenticación multifactor (MFA).
Por último, puede conectarse a cualquier ADLS Gen 2 desde el portal de administración, pero si se conecta directamente a un área de trabajo, primero debe asegurarse de que no haya flujos de datos en el área de trabajo antes de conectarse.
Nota:
Traiga su propio almacenamiento (Azure Data Lake Gen 2) no está disponible en el servicio Power BI para los clientes de GCC de la Administración Pública de Estados Unidos. Para obtener más información sobre qué características están disponibles y cuáles no, consulte Disponibilidad de características de Power BI para los clientes de la Administración Pública de Estados Unidos.
En la tabla siguiente se describen los permisos para ADLS y para Power BI necesarios para ADLS Gen 2 y Power BI:
Acción | Permisos de ADLS | Permisos mínimos de Power BI |
---|---|---|
Conectar ADLS Gen2 al inquilino de Power BI | Propietario | Administrador de Power BI |
Conexión de ADLS Gen 2 al área de trabajo | Propietario | Administrador de áreas de trabajo |
Crear flujos de datos de Power BI escribiendo de nuevo en la cuenta de ADLS conectada | No aplicable | Colaborador del espacio de trabajo |
Consumir flujo de datos de Power BI | No aplicable | Visor del área de trabajo |
Conexión a una instancia de Azure Data Lake Gen 2 en un nivel de área de trabajo
Vaya a un área de trabajo que no tenga flujos de datos. Seleccione Configuración del área de trabajo. Elija la pestaña Conexiones de Azure y, a continuación, seleccione la sección Almacenamiento .
La opción Usar conexión predeterminada de Azure está visible si el administrador ya ha configurado una cuenta de ADLS Gen 2 asignada por el inquilino. Tiene dos opciones:
- Use la cuenta de ADLS Gen 2 configurada por el inquilino; para ello, seleccione el cuadro denominado Use the default Azure connection (Usar la conexión predeterminada de Azure) o
- Seleccione Conectar a Azure para que apunte a una nueva cuenta de Azure Storage.
Al seleccionar Conectar a Azure, Power BI recupera una lista de suscripciones de Azure a las que tiene acceso. Rellene las listas desplegables. A continuación, elija una suscripción de Azure válida, un grupo de recursos y una cuenta de almacenamiento que tenga habilitada la opción de espacio de nombres jerárquico, que es la marca ADLS Gen2. La cuenta personal que se usa para conectarse a Azure solo se usa una vez, para establecer la conexión inicial y conceder derechos a la cuenta del servicio Power BI para leer y escribir datos, después de lo cual la cuenta de usuario original ya no es necesaria para mantener la conexión activa.
Después de elegir la opción seleccionada, seleccione Guardar y ahora haya conectado correctamente el área de trabajo a su propia cuenta de ADLS Gen2. Power BI configura automáticamente la cuenta de almacenamiento con los permisos necesarios y configura el sistema de archivos de Power BI donde se escribirán los datos. En este momento, los datos de cada flujo de datos dentro de esta área de trabajo escriben directamente en este sistema de archivos, que se pueden usar con otros servicios de Azure. Ahora tiene un único origen para todos los datos organizativos o departamentales.
Configuración de conexiones de Azure
La configuración de conexiones de Azure es un valor opcional con más propiedades que se pueden establecer opcionalmente:
- Almacenamiento de nivel de inquilino, que permite establecer un valor predeterminado, o
- Almacenamiento de nivel de área de trabajo, que le permite especificar la conexión por área de trabajo.
Opcionalmente, puede configurar el almacenamiento de nivel de inquilino si desea usar solo un lago de datos centralizado o desea que este almacenamiento sea la opción predeterminada. No empezamos automáticamente con el valor predeterminado para permitir la flexibilidad en la configuración, por lo que tiene flexibilidad para configurar las áreas de trabajo que usan esta conexión como considere oportuno. Si configura una cuenta de ADLS Gen 2 asignada por el inquilino, todavía tiene que configurar cada área de trabajo para usar esta opción predeterminada.
Opcionalmente, también puede configurar permisos de almacenamiento de nivel de área de trabajo como una opción independiente, lo que proporciona una flexibilidad completa para establecer una cuenta específica de ADLS Gen 2 en un área de trabajo por área de trabajo.
En resumen, si se permiten permisos de almacenamiento de nivel de inquilino y almacenamiento de nivel de área de trabajo, los administradores del área de trabajo pueden usar opcionalmente la conexión de ADLS predeterminada o optar por configurar otra cuenta de almacenamiento independiente del valor predeterminado. Si no se establece el almacenamiento de inquilinos, los administradores del área de trabajo pueden configurar opcionalmente cuentas de ADLS basadas en el área de trabajo. Por último, si el almacenamiento de nivel de inquilino está seleccionado y no se permite el almacenamiento de nivel de área de trabajo, los administradores del área de trabajo pueden configurar opcionalmente sus flujos de datos para que usen esta conexión.
Estructura y formato para las conexiones del área de trabajo de ADLS Gen 2
En la cuenta de almacenamiento de ADLS Gen 2, todos los flujos de datos se almacenan en el contenedor powerbi del sistema de archivos.
La estructura del contenedor de powerbi tiene este aspecto: <workspace name>/<dataflow name>/model.json
, <workspace name>/<dataflow name>/model.json.snapshots/<all snapshots>
y <workspace name>/<dataflow name>/<table name>/<tablesnapshots>
La ubicación donde los flujos de datos almacenan datos en la jerarquía de carpetas de ADLS Gen 2 es la misma si el área de trabajo se encuentra en capacidad compartida o Capacidad Premium.
En el ejemplo siguiente se usa la tabla Orders del ejemplo Northwind Odata.
En la imagen anterior:
- El model.json es la versión más reciente del flujo de datos.
- Las model.json.snapshots son todas las versiones anteriores del flujo de datos. Este historial es útil si necesita una versión anterior de mashup o una configuración incremental.
- Tablename es la carpeta que contiene los datos resultantes después de que se haya completado una actualización de flujo de datos.
Solo se escribe en esta cuenta de almacenamiento y actualmente no se eliminan los datos. Por lo tanto, incluso después de desasociar, no eliminamos de la cuenta de ADLS, por lo que todos los archivos mencionados en la lista anterior siguen almacenados.
Nota:
Los flujos de datos permiten vincular o hacer referencia a tablas en otros flujos de datos. En estos flujos de datos, el archivo model.json puede hacer referencia a otro model.json de otro flujo de datos en el mismo área de trabajo u otra.
Mover archivos entre cuentas de almacenamiento de ADLS Gen 2 o dentro de ellas
Al mover un flujo de datos de una cuenta de almacenamiento de ADLS Gen2 a otra, debe asegurarse de que las rutas de acceso del archivo model.json se actualizan para reflejar la nueva ubicación. Esto se debe a que el archivo model.json contiene la ruta de acceso al flujo de datos y la ruta de acceso a los datos. Si no actualiza las rutas de acceso, el flujo de datos no podrá encontrar los datos y provocará errores de permisos. Para actualizar las rutas de acceso, puede seguir estos pasos:
- Abra el archivo model.json en un editor de texto.
- Busque la dirección URL de la cuenta de almacenamiento y reemplácela por la nueva dirección URL de la cuenta de almacenamiento.
- Guarde el archivo.
- Sobrescriba el archivo model.json existente en la cuenta de almacenamiento de ADLS Gen2.
Extensibilidad de las conexiones del área de trabajo de ADLS Gen 2
Si va a conectar ADLS Gen2 a Power BI, puede hacerlo a nivel de área de trabajo o de inquilino. Asegúrese de que tiene el nivel de acceso correcto. Más información en Requisitos previos.
La estructura de almacenamiento cumple el formato common Data Model. Para más información sobre la estructura de almacenamiento y CDM, visite ¿Qué es la estructura de almacenamiento para los flujos de datos analíticos ? y Use the Common Data Model to optimize Azure Data Lake Storage Gen2 (Uso de Common Data Model para optimizar Azure Data Lake Storage Gen2).
Una vez configurados correctamente, los datos y los metadatos están bajo tu control. Muchas aplicaciones son conscientes del CDM y los datos se pueden ampliar mediante Azure, PowerApps y Power Automate. También puede usar ecosistemas de terceros, ya sea conforme al formato o leyendo los datos sin procesar.
Desasociación de Azure Data Lake Gen 2 de un área de trabajo o un inquilino
Para quitar una conexión en un nivel de área de trabajo, primero debe asegurarse de que se eliminan todos los flujos de datos del área de trabajo. Después de quitar todos los flujos de datos, seleccione Desconectar en la configuración del área de trabajo. Lo mismo se aplica a un inquilino, pero primero debe asegurarse de que todas las áreas de trabajo también se han desconectado de la cuenta de almacenamiento del inquilino antes de poder desconectarse a nivel de arrendatario.
Deshabilitación de Azure Data Lake Gen 2
En el portal de administración, en flujos de datos, puede deshabilitar el acceso para que los usuarios usen esta característica y no permitir que los administradores del área de trabajo traigan su propia instancia de Azure Storage.
Revertir de Azure Data Lake Gen 2
Una vez configurado el almacenamiento de flujo de datos para usar Azure Data Lake Gen 2, no hay forma de revertir automáticamente. El proceso para volver al almacenamiento administrado por Power BI es manual.
Para revertir la migración realizada a Gen 2, debe eliminar los flujos de datos y volver a crearlos en la misma área de trabajo. A continuación, dado que no eliminamos datos de ADLS Gen 2, vaya al propio recurso y limpie los datos. Esta acción implicaría los pasos siguientes.
Exporte una copia del flujo de datos desde Power BI. O bien, copie el archivo model.json. El archivo model.json se almacena en ADLS.
Elimine los flujos de datos.
Desconectar ADLS.
Vuelva a crear los flujos de datos mediante la importación. Los datos de actualización incremental (si procede) deberán eliminarse antes de la importación. Esta acción se puede realizar eliminando las particiones pertinentes en el archivo model.json.
Configurar directivas para actualizar o volver a crear actualizaciones incrementales.
Conexión a los datos mediante el conector de ADLS Gen 2
El ámbito de este documento describe las conexiones de flujos de datos de ADLS Gen 2 y no el conector de Power BI ADLS Gen 2. El uso del conector de ADLS Gen2es un escenario independiente, posiblemente aditivo. El conector de ADLS simplemente usa ADLS como origen de datos. Por lo tanto, el uso de Power Query Online para consultar esos datos no tiene que estar en formato CDM, puede ser el formato de datos que quiera el cliente. Para más información, consulte Azure Data Lake Storage Gen2.
Contenido relacionado
En los artículos siguientes encontrará más información sobre los flujos de datos y Power BI:
- Introducción a los flujos de datos y la preparación de datos de autoservicio
- Creación de un flujo de datos
- Configurar y consumir un flujo de datos
- Características prémium de flujos de datos
- Inteligencia artificial con flujos de datos
- Consideraciones y limitaciones de los flujos de datos
- Procedimientos recomendados para flujos de datos