Compartir a través de


Consideraciones y limitaciones de flujos de datos

Existen algunas limitaciones de flujo de datos en la creación, las actualizaciones y la administración de capacidad que los usuarios deben tener en cuenta, como se describe en las secciones siguientes.

Limitaciones generales

  • Es posible que los flujos de datos no estén disponibles para todos los clientes del DoD del Gobierno de Estados Unidos. La paridad de características en los entornos gubernamentales se puede encontrar en el artículo Disponibilidad de características de Power BI para la administración pública .
  • Los orígenes de datos eliminados no se quitan de la página del origen de datos, lo cual es un comportamiento benigno y no afecta al refresco ni a la edición de flujos de datos. En la vista de Linaje, los orígenes de datos eliminados aparecen como linaje para un flujo de datos.
  • Los orígenes de datos eliminados siguen apareciendo en la página Configuración de la lista desplegable del gateway.
  • La profundidad equivale a los flujos de datos vinculados a otros flujos de datos. La profundidad máxima actual es 32.
  • La amplitud equivale a las entidades dentro de un flujo de datos.
    • No hay instrucciones ni límites para el número óptimo de entidades en un flujo de datos; sin embargo, los flujos de datos compartidos tienen un límite de actualización de dos horas por entidad y tres por flujo de datos. Por lo tanto, si tiene dos entidades y cada una tarda dos horas, no debe colocarlas en el mismo flujo de datos.
    • Para Power BI Premium, las instrucciones y los límites se basan en casos de uso individuales en lugar de en requisitos específicos. El único límite para Power BI Premium es una actualización de 24 horas por flujo de datos.
  • Se requiere una suscripción a Power BI Premium para actualizar más de 10 flujos de datos entre áreas de trabajo.
  • Las limitaciones de PowerQuery se encuentran en el artículo Límites de Power Query Online .
  • Los flujos de datos de Power BI no admiten el uso de variables globales en un argumento de dirección URL.
  • Actualmente no se admite Multi-Geo a menos que configure el almacenamiento para usar su propia cuenta de almacenamiento de Azure Data Lake Gen2.
  • La compatibilidad con redes virtuales se logra mediante una puerta de enlace.
  • Cuando utilices entidades calculadas con orígenes de datos de puerta de enlace, la ingesta de datos debe realizarse en orígenes de datos distintos a los utilizados para los cálculos. Las entidades calculadas deben basarse en entidades que solo son usadas para la incorporación de datos y no ingerir datos dentro de las etapas de combinación de datos propias.
  • En los flujos de datos de Power BI, puede usar parámetros, pero no puede editarlos a menos que edite todo el flujo de datos. A este respecto, los parámetros de los flujos de datos se comportan de forma similar a las constantes declaradas.
  • Algunos conectores encontrados en Solución de problemas de escenarios de actualización no se admiten para flujos de datos y datamarts en áreas de trabajo Premium.
  • Cuando se usa DirectQuery con un flujo de datos, las búsquedas mediante el objeto visual de segmentación distinguen mayúsculas de minúsculas.
  • No se permiten los siguientes caracteres en entidades de flujo de datos: \/

Creación de flujos de datos

Al crear flujos de datos, tenga en cuenta las siguientes consideraciones:

  • La creación en flujos de datos se realiza en el entorno de Power Query Online (PQO); consulte las limitaciones descritas en Límites de Power Query. Dado que la creación de flujos de datos se realiza en el entorno de Power Query Online (PQO), las actualizaciones realizadas en las configuraciones de carga de trabajo de flujos de datos solo afectan a las actualizaciones y no tienen ningún efecto en la experiencia de creación.

  • Sus propietarios solo pueden modificar los flujos de datos.

  • Los flujos de datos no están disponibles en Mi área de trabajo.

  • Los flujos de datos que usan orígenes de datos de puerta de enlace no admiten varias credenciales para el mismo origen de datos.

  • El uso del conector Web.Page requiere una puerta de enlace.

  • En la experiencia de edición de flujos de datos Gen1, es posible que los usuarios no puedan quitar una conexión de puerta de enlace de datos local del flujo de datos mediante "Opciones", "Proyecto", "Carga de datos", y seleccionando "(ninguno)" en la lista desplegable Puerta de enlace de datos. Los pasos siguientes pueden resolver el problema:

    1. Empiece a editar el flujo de datos donde desea eliminar la conexión del Gateway de datos local.
    2. Seleccione Opciones>Carga de datos del proyecto>Puerta de enlace de datos, seleccione Ninguno y, después, Aceptar.
    3. Si aparece una advertencia amarilla con un botón "Configurar conexión", seleccione Configurar conexión, seleccione la conexión en la nube en el cuadro desplegable e inserte credenciales si es necesario para la conexión en la nube.
    4. Seleccione Administrar conexiones> y, a continuación, seleccione el botón Desvincular de la conexión de puerta de enlace.
    5. Cierre el cuadro de diálogo Administrar conexiones , si requiere que vuelva a "Configurar conexión", hágalo. Seleccione Guardar y cerrar y espere a que se complete la operación de guardado.
    6. Si la advertencia "Configurar conexión" no aparece después de aplicar los pasos anteriores, aplique los pasos anteriores, guarde y cierre el flujo de datos, vuelva a editarlo y compruebe la advertencia "Configurar conexión" para que aparezca para que realice una acción en él.

    Si la conexión a la puerta de enlace todavía no se quita del flujo de datos, es posible que tenga que volver a crear un nuevo flujo de datos con las mismas consultas, no enlazado a la puerta de enlace.

Consideraciones sobre las API

Puede encontrar más información sobre las API REST de flujos de datos compatibles en la referencia de la API REST. Estas son algunas consideraciones que debe tener en cuenta:

  • La exportación e importación de un flujo de datos proporciona a ese flujo de datos un nuevo identificador.

  • La importación de flujos de datos que contienen tablas vinculadas no actualiza las referencias existentes dentro del flujo de datos (estas consultas se deben actualizar manualmente antes de importar el flujo de datos).

  • Al implementar un flujo de datos, puede usar los controladores de conflictos GenerateUniqueName y Abort para anular la operación cuando ya exista o indicar a la API que cree automáticamente un nombre único. Los flujos de datos se pueden sobrescribir con el parámetro CreateOrOverwrite , si se han creado inicialmente mediante la API de importación.

Flujos de datos en capacidades compartidas

Existen limitaciones para los flujos de datos en capacidades compartidas (capacidades no Premium):

  • Cuando se actualiza un flujo de datos, los tiempos de espera de una capacidad compartida son de 2 horas por tabla y 3 horas por flujo de datos.
  • Las tablas vinculadas no se pueden crear en flujos de datos compartidos, aunque pueden existir dentro del flujo de datos siempre que la propiedad Load Enabled de la consulta esté deshabilitada.
  • Las tablas calculadas no se pueden crear en flujos de datos compartidos.
  • AutoML y Cognitive Services no están disponibles en flujos de datos compartidos.
  • La actualización incremental no funciona en flujos de datos compartidos.

Flujos de datos en Premium

Los flujos de datos que existen en Premium tienen las siguientes consideraciones y limitaciones.

Actualizaciones y consideraciones de datos:

  • Al actualizar flujos de datos, los tiempos de espera son de 24 horas (sin distinción para tablas o flujos de datos).

  • Al cambiar un flujo de datos de una directiva de actualización incremental a una actualización normal, o viceversa, se quitan todos los datos.

  • Al modificar el esquema de un flujo de datos, se quitan todos los datos.

  • Cuando se usa una licencia Premium por usuario (PPU) con flujos de datos, los datos se borran al mover los datos fuera de un entorno de PPU.

  • Cuando se actualiza un flujo de datos en un contexto de Premium por Usuario (PPU), los datos no son visibles para los usuarios sin PPU.

  • La actualización incremental solo funciona con flujos de datos cuando el motor de proceso mejorado está habilitado.

Tablas vinculadas y calculadas:

  • Las tablas vinculadas pueden bajar a una profundidad de 32 referencias.

  • No se permiten dependencias cíclicas de tablas vinculadas.

  • Una tabla vinculada no se puede combinar con una tabla normal que obtiene sus datos de un origen de datos local.

  • Cuando se usa una consulta (consulta A, por ejemplo) en el cálculo de otra consulta (consulta B) en flujos de datos, la consulta B se convierte en una tabla calculada. Las tablas calculadas no pueden hacer referencia a orígenes locales.

  • No se admiten tablas vinculadas que hacen referencia a entidades en distintos inquilinos.

Motor de proceso:

  • Al usar el motor de cómputo, hay un incremento inicial aproximado de 10% a 20% en el tiempo de ingesta de datos.

    • Esto solo se aplica al primer flujo de datos que se encuentra en el motor de cálculo y lee datos del origen de datos.
    • Los flujos de datos posteriores que usan el flujo de datos de origen no conllevan la misma penalización.
  • Solo ciertas operaciones usan el motor de proceso y solo cuando se usan a través de una tabla vinculada o como tabla calculada. En esta entrada de blog encontrará una lista completa de las operaciones.

Administración de capacidad:

  • Por diseño, las capacidades premium de Power BI tienen un Administrador de recursos interno que limita las cargas de trabajo de diferentes maneras cuando la capacidad se ejecuta en poca memoria.

    1. En el caso de los flujos de datos, esta presión de limitación reduce el número de contenedores M disponibles.
    2. La memoria para el flujo de datos se puede establecer en 100%, con un contenedor de tamaño adecuado a los datos y la carga de trabajo gestiona el número de contenedores correctamente.
  • El número aproximado de contenedores se puede averiguar dividiendo la memoria total asignada a la carga de trabajo por la cantidad de memoria asignada a un contenedor.

Uso del flujo de datos en modelos semánticos

  • Al crear un modelo semántico en Power BI Desktop y, a continuación, publicarlo en el servicio Power BI, asegúrese de que las credenciales usadas en Power BI Desktop para el origen de datos de flujos de datos son las mismas credenciales que se usan cuando el modelo semántico se publica en el servicio.
    1. Error al asegurarse de que esas credenciales sean las mismas, resulta en un error de clave no encontrada al actualizar el modelo semántico.

Nota:

Si se cambia la estructura del flujo de datos, como añadir una columna nueva o renombrar una existente, el modelo semántico no muestra el cambio, y esto también puede provocar que una actualización de datos falle en el servicio Power BI, hasta que se actualice en Power BI Desktop y se vuelva a publicar.

Flujos de datos y conexiones con nombre

Al usar flujos de datos con conexiones con nombre, se aplican las siguientes limitaciones:

  • Solo puedes crear una conexión en la nube de una ruta y un tipo concretos; por ejemplo, solo podrías crear una conexión en la nube de SQL más un servidor o una base de datos. Puede crear varias conexiones de puerta de enlace.
  • No se puede asignar nombre ni cambiar el nombre de los orígenes de datos en la nube; Puede asignar un nombre o cambiar el nombre de las conexiones de puerta de enlace.

Limitaciones de ADLS

  • ADLS no está disponible en entornos GCC, GCC High o DOD. Para obtener más información, consulte Power BI para clientes de la administración pública de EE. UU..
  • Debe ser asignado como propietario del recurso, a causa de los cambios en las API de ADLS Gen 2.
  • No se admite la migración de suscripciones de Azure, pero hay dos alternativas para hacerlo:
    • Primer enfoque: después de la migración, el usuario puede separar áreas de trabajo y volver a adjuntarlas. Si usa la cuenta de nivel de arrendatario, debe desasociar todas las áreas de trabajo, luego desasociar al nivel de arrendatario y volver a asociarlo. Esto puede no ser deseable para los clientes que no quieran eliminar todos sus flujos de datos o que tengan muchas áreas de trabajo.
    • Segundo enfoque: si el enfoque anterior no es factible, envíe una solicitud de soporte técnico para cambiar el identificador de suscripción en la base de datos.
  • ADLS no admite la mayoría de los elementos de la lista en la sección Directorios y nombres de archivo del artículo sobre nomenclatura de áreas de trabajo y nomenclatura de flujos de datos, debido a las siguientes limitaciones:
    • Power BI devuelve un error no útil o permite que se produzca el proceso, pero se produce un error en la actualización.
  • No se admiten suscripciones de ADLS entre inquilinos. El ADLS asociado a Power BI debe formar parte del mismo inquilino de Azure que usa Power BI para el identificador de Entra de Microsoft.

Tipos de datos de flujo

Los tipos de datos admitidos en los flujos de datos son los siguientes:

Tipo de datos mashup Tipo de datos de flujo
Tiempo Tiempo
Fecha Fecha
Fecha y hora Fecha y hora
Fecha, hora y zona horaria Desplazamiento de Fecha y Hora
Lógico Booleano
Mensaje de texto Cuerda
Cualquiera Cuerda
Divisa Decimal
Int8 Int64
Int16 Int64
Int32 Int64
Int64 Int64
Doble Doble
Porcentaje Doble
Soltero Doble
Decimal Doble
Número Doble
Duración No está soportado
Binario No está soportado
Función No está soportado
Tabla No está soportado
Lista No está soportado
Registro No está soportado
Tipo No está soportado
Acción No está soportado
Ninguno No está soportado
Nulo No está soportado

En los artículos siguientes encontrará más información sobre los flujos de datos y Power BI: