Power BI와 함께 사용되는 데이터는 기본적으로 Power BI에서 제공하는 내부 스토리지에 저장됩니다. 데이터 흐름과 ADLS Gen2(Azure Data Lake Storage Gen2)의 통합을 통해 조직의 Azure Data Lake Storage Gen2 계정에 데이터 흐름을 저장할 수 있습니다. 이 기능을 사용하면 기본적으로 Power BI 데이터 흐름에 "사용자 고유의 스토리지를 가져오고" 테넌트 또는 작업 영역 수준에서 연결을 설정할 수 있습니다.
ADLS Gen 2 작업 영역 또는 테넌트 연결을 사용하는 이유
데이터 흐름을 연결한 후 Power BI는 이제 자신의 ADLS Gen 2에 데이터를 읽고 쓸 수 있도록 참조를 구성하고 저장합니다. Power BI는 데이터 흐름 자체에서 생성된 실제 데이터 외에도 데이터에 대한 메타데이터를 캡처하는 CDM(공용 데이터 모델) 형식으로 데이터를 저장합니다. 이 기능은 많은 강력한 기능의 잠금을 해제하고 CDM 형식의 데이터 및 관련 메타데이터가 이제 확장성, 자동화, 모니터링 및 백업 시나리오를 제공할 수 있도록 합니다. 사용자 고유의 환경에서 이 데이터를 사용할 수 있고 광범위하게 액세스할 수 있게 하면 조직 내에서 만든 인사이트와 데이터를 민주화할 수 있습니다. 또한 다양한 복잡성으로 추가 솔루션을 만들 수 있는 기능도 제공합니다. 솔루션은 Power Platform, Azure의 CDM 인식 사용자 지정 애플리케이션 및 솔루션이며 파트너 및 ISV(독립 소프트웨어 공급업체) 에코시스템을 통해 사용할 수 있습니다. 또는 CSV를 읽는 애플리케이션을 만들 수 있습니다. 이제 데이터 엔지니어, 데이터 과학자 및 분석가가 ADLS Gen 2에서 큐레이팅된 공통 데이터 집합을 사용, 사용 및 재사용할 수 있습니다.
사용할 ADLS Gen 2 저장소를 구성하는 방법에는 테넌트 할당 ADLS Gen 2 계정을 사용하거나 작업 영역 수준에서 고유한 ADLS Gen 2 저장소를 가져올 수 있습니다.
필수 조건
사용자 고유의 ADLS Gen 2 계정을 가져오려면 스토리지 계정 계층에서 소유자 권한이 있어야 합니다. 리소스 그룹 또는 구독 수준의 권한은 작동하지 않습니다. 관리자인 경우에도 소유자 권한을 할당해야 합니다. 현재 방화벽 뒤에 있는 ADLS Gen2 스토리지 계정을 지원하지 않습니다.
스토리지 계정은 HNS(계층 구조 네임스페이스)를 사용하도록 설정하여 만들어야 합니다.
스토리지 계정은 Power BI 테넌트와 동일한 Microsoft Entra 테넌트에 만들어야 합니다.
사용자에게 스토리지 Blob 데이터 소유자 역할, Storage Blob 데이터 판독기 역할 및 스토리지 계정 수준에서 소유자 역할이 있어야 합니다(범위는 이 리소스 여야 하며 상속되지 않아야 합니다). 적용된 역할 변경 내용을 동기화하는 데 몇 분 정도 걸릴 수 있으며 Power BI 서비스에서 다음 단계를 완료하기 전에 동기화해야 합니다.
Pro 작업 영역의 경우 스토리지 계정은 패브릭 홈 지역과 동일한 지역에 있어야 합니다. 프리미엄 작업 영역의 경우 스토리지 계정은 프리미엄 용량과 동일한 지역에 있어야 합니다.
엔드포인트를 보호하려면 TLS(전송 계층 보안) 버전 1.2 이상이 필요합니다. TLS 1.2 이전 버전의 TLS를 사용하는 웹 브라우저 및 기타 클라이언트 애플리케이션은 연결할 수 없습니다.
MFA(다단계 인증) 뒤에 ADLS Gen 2를 사용하여 데이터 흐름을 연결하는 것은 지원되지 않습니다.
마지막으로 관리 포털에서 ADLS Gen 2에 연결할 수 있지만 작업 영역에 직접 연결하는 경우 연결하기 전에 먼저 작업 영역에 데이터 흐름이 없는지 확인해야 합니다.
비고
사용자 고유의 스토리지 가져오기(Azure Data Lake Gen 2)는 미국 정부 GCC 고객을 위한 Power BI 서비스에서 사용할 수 없습니다. 사용할 수 있는 기능과 사용할 수 없는 기능에 대한 자세한 내용은 미국 정부 고객을 위한 Power BI 기능 가용성을 참조하세요.
다음 표에서는 ADLS Gen 2 및 Power BI에 필요한 ADLS 및 Power BI에 대한 사용 권한을 설명합니다.
조치 | ADLS 권한 | 최소 Power BI 권한 |
---|---|---|
Power BI 테넌트에 ADLS Gen 2 연결 | 소유자 | Power BI 관리자 |
ADLS Gen 2를 작업 영역에 연결 | 소유자 | 작업 영역 관리자 |
연결된 ADLS 계정에 다시 쓰는 Power BI 데이터 흐름 만들기 | 해당 없음 | 작업 영역 기여자 |
Power BI 데이터 흐름 사용 | 해당 없음 | 작업 영역 뷰어 |
작업 영역 수준에서 Azure Data Lake Gen 2에 연결
데이터 흐름이 없는 작업 영역으로 이동합니다. 작업 영역 설정을 선택합니다. Azure 연결 탭을 선택한 다음, 스토리지 섹션을 선택합니다.
관리자가 테넌트 할당 ADLS Gen 2 계정을 이미 구성한 경우 기본 Azure 연결 사용 옵션이 표시됩니다. 두 가지 옵션이 있습니다.
- 기본 Azure 연결 사용이라는 상자를 선택하여 테넌트 구성 ADLS Gen 2 계정을 사용하거나
- Azure에 연결을 선택하여 새 Azure Storage 계정을 가리킵니다.
Azure에 연결을 선택하면 Power BI는 액세스 권한이 있는 Azure 구독 목록을 검색합니다. 드롭다운을 채웁니다. 그런 다음, ADLS Gen2 플래그인 계층 구조 네임스페이스 옵션을 사용하도록 설정된 유효한 Azure 구독, 리소스 그룹 및 스토리지 계정을 선택합니다. Azure에 연결하는 데 사용되는 개인 계정은 초기 연결을 설정하고 Power BI 서비스 계정에 데이터를 읽고 쓸 수 있는 권한을 부여하기 위해 한 번만 사용되며, 그 후에는 원래 사용자 계정이 더 이상 연결을 활성 상태로 유지할 필요가 없습니다.
선택한 후 저장 을 선택하면 작업 영역을 사용자 고유의 ADLS Gen2 계정에 성공적으로 연결했습니다. Power BI는 필요한 권한으로 스토리지 계정을 자동으로 구성하고 데이터를 쓸 Power BI 파일 시스템을 설정합니다. 이 시점에서 이 작업 영역 내의 모든 데이터 흐름 데이터는 다른 Azure 서비스와 함께 사용할 수 있는 이 파일 시스템에 직접 기록됩니다. 이제 모든 조직 또는 부서 데이터에 대한 단일 원본이 있습니다.
Azure 연결 구성
Azure 연결을 구성하는 것은 선택적으로 설정할 수 있는 더 많은 속성을 포함하는 선택적 설정입니다.
- 기본값 및/또는을 설정할 수 있는 테넌트 수준 스토리지
- 작업 영역 수준 스토리지- 작업 영역당 연결을 지정할 수 있습니다.
중앙 집중식 데이터 레이크만 사용하거나 이 스토리지를 기본 옵션으로 사용하려는 경우 필요에 따라 테넌트 수준 스토리지를 구성할 수 있습니다. 구성의 유연성을 허용하기 위해 기본값을 사용하여 자동으로 시작하지 않으므로 이 연결을 사용하는 작업 영역을 유연하게 구성할 수 있습니다. 테넌트 할당 ADLS Gen 2 계정을 구성하는 경우에도 이 기본 옵션을 사용하도록 각 작업 영역을 구성해야 합니다.
필요에 따라 작업 영역 수준 스토리지 권한을 별도의 옵션으로 구성하여 작업 영역별로 특정 ADLS Gen 2 계정을 설정할 수 있는 완전한 유연성을 제공합니다.
요약하자면, 테넌트 수준 스토리지 및 작업 영역 수준 스토리지 권한이 허용되는 경우 작업 영역 관리자는 필요에 따라 기본 ADLS 연결을 사용하거나 기본값과 별도로 다른 스토리지 계정을 구성하도록 선택할 수 있습니다. 테넌트 스토리지가 설정되지 않은 경우 작업 영역 관리자는 필요에 따라 작업 영역별로 ADLS 계정을 구성할 수 있습니다. 마지막으로 테넌트 수준 스토리지를 선택하고 작업 영역 수준 스토리지가 허용되지 않는 경우 작업 영역 관리자는 필요에 따라 이 연결을 사용하도록 데이터 흐름을 구성할 수 있습니다.
ADLS Gen 2 작업 영역 연결의 구조 및 형식
ADLS Gen 2 스토리지 계정에서 모든 데이터 흐름은 파일 시스템의 powerbi 컨테이너에 저장됩니다.
powerbi 컨테이너의 구조는 다음과 <workspace name>/<dataflow name>/model.json
<workspace name>/<dataflow name>/model.json.snapshots/<all snapshots>
같습니다.<workspace name>/<dataflow name>/<table name>/<tablesnapshots>
데이터 흐름이 ADLS Gen 2의 폴더 계층 구조에 데이터를 저장하는 위치는 작업 영역이 공유 용량 또는 프리미엄 용량에 있는지와 동일합니다.
다음 예제에서는 Northwind Odata 샘플의 Orders 테이블을 사용합니다.
이전 이미지에서 다음을 수행합니다.
- model.json 데이터 흐름의 최신 버전입니다.
- model.json.snapshots는 모두 이전 버전의 데이터 흐름입니다. 이 기록은 이전 버전의 매시업 또는 증분 설정이 필요한 경우에 유용합니다.
- 테이블 이름은 데이터 흐름 새로 고침이 완료된 후 결과 데이터를 포함하는 폴더입니다.
이 스토리지 계정에만 쓰고 현재 데이터를 삭제하지 않습니다. 따라서 분리 후에도 ADLS 계정에서 삭제하지 않으므로 이전 목록에 언급된 모든 파일이 계속 저장됩니다.
비고
데이터 흐름을 사용하면 다른 데이터 흐름의 테이블을 연결하거나 참조할 수 있습니다. 이러한 데이터 흐름에서 model.json 파일은 동일하거나 다른 작업 영역에 있는 다른 데이터 흐름의 다른 model.json 참조할 수 있습니다.
ADLS Gen 2 스토리지 계정 간/내 파일 이동
한 ADLS Gen2 스토리지 계정에서 다른 계정으로 데이터 흐름을 이동하는 경우 model.json 파일의 경로가 새 위치를 반영하도록 업데이트되었는지 확인해야 합니다. 이는model.json 파일에 데이터 흐름의 경로와 데이터 경로가 포함되어 있기 때문입니다. 경로를 업데이트하지 않으면 데이터 흐름에서 데이터를 찾을 수 없으며 사용 권한 오류가 발생합니다. 경로를 업데이트하려면 다음 단계를 사용할 수 있습니다.
- 텍스트 편집기에서 model.json 파일을 엽니다.
- 스토리지 계정 URL을 찾아 새 스토리지 계정 URL로 바꿉니다.
- 파일을 저장합니다.
- ADLS Gen2 스토리지 계정에서 기존 model.json 파일을 덮어씁니다.
ADLS Gen 2 작업 영역 연결에 대한 확장성
ADLS Gen 2를 Power BI에 연결하는 경우 작업 영역 또는 테넌트 수준에서 이 작업을 수행할 수 있습니다. 올바른 액세스 수준이 있는지 확인합니다. 필수 조건에서 자세히 알아보세요.
스토리지 구조는 공통 데이터 모델 형식을 준수합니다. 분석 데이터 흐름에 대한 스토리지 구조란 무엇이며공통 데이터 모델을 사용하여 Azure Data Lake Storage Gen2를 최적화하여 스토리지 구조 및 CDM에 대해 자세히 알아봅니다.
올바르게 구성되면 데이터와 메타데이터가 제어됩니다. 많은 애플리케이션은 CDM을 알고 있으며 Azure, PowerApps 및 Power Automate를 사용하여 데이터를 확장할 수 있습니다. 형식을 준수하거나 원시 데이터를 읽어 타사 에코시스템을 사용할 수도 있습니다.
작업 영역 또는 테넌트에서 Azure Data Lake Gen 2 분리
작업 영역 수준에서 연결을 제거하려면 먼저 작업 영역의 모든 데이터 흐름이 삭제되었는지 확인해야 합니다. 모든 데이터 흐름이 제거된 후 작업 영역 설정에서 연결을 끊 습니다. 테넌트에도 동일하게 적용되지만 먼저 테넌트 수준에서 연결을 끊기 전에 모든 작업 영역이 테넌트 스토리지 계정과 연결이 끊어졌는지 확인해야 합니다.
Azure Data Lake Gen 2 사용 안 함
관리 포털의 데이터 흐름에서 사용자가 이 기능을 사용하도록 액세스를 사용하지 않도록 설정하고 작업 영역 관리자가 자신의 Azure Storage를 가져오지 못하도록 할 수 있습니다.
Azure Data Lake Gen 2에서 되돌리기
Azure Data Lake Gen 2를 사용하도록 데이터 흐름 스토리지를 구성한 후에는 자동으로 되돌릴 방법이 없습니다. Power BI 관리형 스토리지로 돌아가는 프로세스는 수동입니다.
Gen 2로 마이그레이션을 되돌리려면 데이터 흐름을 삭제하고 동일한 작업 영역에서 다시 만들어야 합니다. 그런 다음 ADLS Gen 2에서 데이터를 삭제하지 않으므로 리소스 자체로 이동하여 데이터를 정리합니다. 이 작업에는 다음 단계가 포함 됩니다.
Power BI에서 데이터 흐름의 복사본을 내보냅니다. 또는 model.json 파일을 복사합니다. model.json 파일은 ADLS에 저장됩니다.
데이터 흐름을 삭제합니다.
ADLS를 분리합니다.
가져오기를 사용하여 데이터 흐름을 다시 만듭니다. 가져오기 전에 증분 새로 고침 데이터(해당하는 경우)를 삭제해야 합니다. 이 작업은 model.json 파일에서 관련 파티션을 삭제하여 수행할 수 있습니다.
새로 고침을 구성/증분 새로 고침 정책을 다시 만듭니다.
ADLS Gen 2 커넥터를 사용하여 데이터에 연결
이 문서의 범위는 Power BI ADLS Gen 2 커넥터가 아닌 ADLS Gen 2 데이터 흐름 연결을 설명합니다. ADLS Gen 2 커넥터를 사용하는 것은 별도의 추가 시나리오입니다. ADLS 커넥터는 ADLS를 데이터 원본으로 사용하기만 하면 됩니다. 따라서 파워 쿼리 온라인을 사용하여 해당 데이터에 대해 쿼리하는 것은 CDM 형식일 필요가 없으며 고객이 원하는 데이터 형식일 수 있습니다. 자세한 내용은 Azure Data Lake Storage Gen2를 참조하세요.
관련 콘텐츠
다음 문서에서는 데이터 흐름 및 Power BI에 관한 자세한 정보를 제공합니다.