ODBC를 사용하여 Microsoft Power BI Desktop을 Azure HDInsight에 연결하고 Apache Hive 데이터를 시각화하는 방법을 알아봅니다.
중요합니다
Hive ODBC 드라이버를 활용하여 Power BI Desktop의 일반 ODBC 커넥터를 통해 가져올 수 있습니다. 그러나 Hive 쿼리 엔진의 비대화형 특성을 고려할 때 BI 워크로드에는 권장되지 않습니다. HDInsight 대화형 쿼리 커넥터 및 HDInsight Spark 커넥터 는 성능에 더 적합한 선택입니다.
이 문서에서는 Hive 테이블에서 Power BI로 hivesampletable
데이터를 로드합니다. Hive 테이블에는 일부 휴대폰 사용 현황 데이터가 포함되어 있습니다. 그런 다음 전 세계 맵에 사용량 현황 데이터를 그림으로 나타냅니다.
이 정보는 새 대화형 쿼리 클러스터 유형에도 적용됩니다. 직접 쿼리를 사용하여 HDInsight 대화형 쿼리에 연결하는 방법은 Azure HDInsight에서 직접 쿼리를 사용하여 Microsoft Power BI를 사용하여 대화형 쿼리 Hive 데이터 시각화를 참조하세요.
필수 조건
이 문서를 시작하기 전에 다음 항목이 있어야 합니다.
HDInsight 클러스터. 클러스터는 Hive가 있는 HDInsight 클러스터 또는 새로 릴리스된 대화형 쿼리 클러스터일 수 있습니다. 클러스터를 만드는 방법은 클러스터 만들기를 참조하세요.
Microsoft Power BI Desktop. Microsoft 다운로드 센터에서 복사본을 다운로드할 수 있습니다.
Hive ODBC 데이터 원본 만들기
HDInsight에서 데이터 로드
hivesampletable Hive 테이블은 모든 HDInsight 클러스터와 함께 제공됩니다.
Power BI Desktop을 시작합니다.
위쪽 메뉴에서 홈>데이터>가져오기 자세히...로 이동합니다.
데이터 가져오기 대화 상자에서 왼쪽에서 기타를 선택하고 오른쪽에서 ODBC를 선택한 다음 아래쪽에서 연결을 선택합니다.
ODBC에서 시작 대화 상자의 드롭다운 목록에서 마지막 섹션에서 만든 데이터 원본 이름을 선택합니다. 그런 다음 확인을 선택합니다.
처음 사용하는 경우 ODBC 드라이버 대화 상자가 열립니다. 왼쪽 메뉴에서 기본값 또는 사용자 지정 을 선택합니다. 그런 다음 연결을 선택하여 탐색기를 엽니다.
탐색기 대화 상자에서 ODBC > HIVE > 기본값을 확장하고 hivesampletable을 선택한 다음 로드를 선택합니다.
데이터 시각화
마지막 절차에서 계속 진행합니다.
시각화 창에서 지도를 선택하세요. 이는 지구본 아이콘입니다.
필드 창에서 국가 및 devicemake를 선택합니다. 지도에 그려진 데이터를 볼 수 있습니다.
맵을 확장합니다.
다음 단계
이 문서에서는 Power BI를 사용하여 HDInsight에서 데이터를 시각화하는 방법을 알아보았습니다. 자세한 내용은 다음 문서를 참조하세요.