このチュートリアルは、架空の会社である Adventure Works Cycles に基づいています。 Adventure Works Cycles は、北米、ヨーロッパ、アジアの商業市場に金属および複合自転車を製造および販売する大規模な多国籍製造会社です。 Adventure Works Cycles の本社はワシントン州ボセルで、500 人の従業員を雇用しています。 さらに、Adventure Works Cycles では、市場ベース全体で複数の地域営業チームを採用しています。
近年、Adventure Works Cycles はメキシコに位置する小規模な製造工場 Importadores Neptuno を買収しました。 Importadores Neptuno は、Adventure Works Cycles 製品ラインの重要なサブコンポーネントをいくつか製造しています。 これらのサブコンポーネントは、最終製品アセンブリの Bothell の場所に出荷されます。 2005年にインポーターネプトゥーノは、ツーリング自転車製品グループの唯一のメーカーとディストリビューターになりました。
成功した会計年度の後、Adventure Works Cycles は、最高の顧客に広告をターゲットにし、外部 Web サイトを通じて製品の可用性を拡張し、生産コストを削減することで売上コストを削減することで、市場シェアを拡大したいと考えています。
現在の分析環境
販売チームやマーケティング チーム、上級管理者のデータ分析ニーズをサポートするために、現在、AdventureWorks2012 データベースからトランザクション データと、スプレッドシートからの販売クォータなどの非トランザクション情報を取得し、この情報を AdventureWorksDW2012 リレーショナル データ ウェアハウスに統合しています。 ただし、リレーショナル データ ウェアハウスには次の課題があります。
レポートは静的です。 ユーザーは、Microsoft Office Excel のピボットテーブルのような方法で、レポート内のデータを対話的に探索し、詳細な情報を取得することができません。 多くのユーザーには、既存の定義済みレポートセットで十分ですが、より高度なユーザーは、対話型クエリと特殊なレポートのためにデータベースに直接クエリアクセスする必要があります。 ただし、 AdventureWorksDW2012 データベースの複雑さのため、このようなユーザーが効果的なクエリを作成する方法を学習するには時間がかかりすぎます。
クエリのパフォーマンスは大きく変動します。 たとえば、一部のクエリでは数秒で結果が非常に迅速に返されますが、他のクエリでは返されるまでに数分かかります。
集計テーブルは管理が困難です。 クエリの応答時間を短縮するために、Adventure Works のデータ ウェアハウス チームは AdventureWorksDW2012 データベースに複数の集計テーブルを作成しました。 たとえば、月別の売上を集計するテーブルを作成しました。 ただし、これらの集計テーブルはクエリのパフォーマンスを大幅に向上させますが、テーブルを一定期間維持するために構築されたインフラストラクチャは脆弱であり、エラーが発生しやすくなります。
複雑な計算ロジックはレポート定義に埋もれ、レポート間で共有することは困難です。 このビジネス ロジックはレポートごとに個別に生成されるため、レポート間で概要情報が異なる場合があります。 そのため、データ ウェアハウス レポートの信頼度は管理によって制限されます。
異なる部署のユーザーは、データのさまざまなビューに関心があります。 各グループは、無関係なデータ要素によって注意が散らされ、混乱します。
計算ロジックは、特殊なレポートを必要とするユーザーにとって特に困難です。 このようなユーザーはレポートごとに計算ロジックを個別に定義する必要があるため、計算ロジックの定義方法を一元的に制御する必要はありません。 たとえば、一部のユーザーは、移動平均などの基本的な統計的手法を使用する必要があることを知っていますが、そのような計算を構築する方法がわからないため、これらの手法を使用しません。
関連する情報のセットを組み合わせるのは困難です。 販売と販売のクォータなど、2 つの関連情報のセットを組み合わせた特殊なクエリは、ビジネス ユーザーが構築するのが困難です。 このようなクエリによってデータベースが過剰に使用されるため、会社ではユーザーがデータ ウェアハウス チームに対して複数の対象領域にまたがるデータ セットを要求する必要があります。 その結果、複数の対象領域のデータを結合する定義済みのレポートが少数しか定義されていません。 さらに、ユーザーは複雑さのためにこれらのレポートを変更しようとすることを嫌がっている。
レポートは主に米国のビジネス情報に焦点を当てています。 米国以外のユーザー子会社はこの焦点に非常に不満を持っており、異なる通貨と異なる言語でレポートを表示できるようにしたいと考えています。
情報の監査は困難です。 財務部門は現在、 AdventureWorksDW2012 データベースを一括クエリのソースとしてのみ使用しています。 その後、個々のスプレッドシートにデータをダウンロードし、データの準備とスプレッドシートの操作にかなりの時間を費やします。 したがって、企業財務報告書は、全社的に準備、監査、管理することが困難です。
ソリューション
データ ウェアハウス チームは最近、現在の分析システムの設計レビューを実行しました。 レビューには、現在の問題と将来の需要のギャップ分析が含まれていました。 データ ウェアハウス チームは、 AdventureWorksDW2012 データベースが、適合したディメンションとサロゲート キーを備えた適切に設計されたディメンション データベースであると判断しました。 適合ディメンションを使用すると、ディメンションを時間ディメンションや製品ディメンションなどの複数のデータ マートで使用できます。 サロゲート キーは、ディメンション テーブルとファクト テーブルをリンクする人工キーであり、一意性を確保し、パフォーマンスを向上させるために使用されます。 さらに、データ ウェアハウス チームは、 AdventureWorksDW2012 データベースのベース テーブルの読み込みと管理に関して、現在重要な問題はないと判断しました。 そのため、チームは Microsoft Analysis Services を使用して次の作業を行うことにしました。
分析分析とレポートのために、共通のメタデータ レイヤーを介して統合されたデータ アクセスを提供します。
ユーザーによるデータの表示を簡素化し、対話型クエリと定義済みクエリと定義済みレポートの両方の開発を高速化します。
複数の対象領域のデータを結合するクエリを正しく構築します。
集計を管理する。
複雑な計算を格納して再利用する。
米国外のビジネス ユーザーにローカライズされたエクスペリエンスを提供します。
Analysis Services チュートリアルのレッスンでは、これらすべての目標を満たすキューブ データベースを構築するためのガイダンスを提供します。 作業を開始するには、最初のレッスン「 レッスン 1: 新しいテーブル モデル プロジェクトを作成する」に進みます。