次の方法で共有


メインフレームとミッドレンジのデータを最新化する

Azure Cosmos DB
Azure Data Lake
Azure SQL Database
Azure SQL Managed Instance
Azure Storage

Apache®、 Spark、および炎のロゴは、米国およびその他の国の Apache Software Foundation の登録商標または商標です。 これらのマークを使用することが、Apache Software Foundation による保証を意味するものではありません。

この記事では、メインフレームおよびミッドレンジ データ ソースのエンド ツー エンドのモダン化計画について説明します。 最新化により、ミッション クリティカルなワークロードのスケーラビリティとパフォーマンスが向上します。

アーキテクチャ

データを Azure に移行してメインフレームシステムとミッドレンジ システムを最新化する方法を示すアーキテクチャ図。

この図は、データを Azure に移行してメインフレームおよびミッドレンジ システムを最新化する方法を示しています。 点線は、図を 2 つの半分に分割します。 左半分はオンプレミスでラベル付けされ、右半分には Azure というラベルが付けられます。 オンプレミスの半分のデータ ストア ボックスには、VSAM フラット ファイル、Db2 zOS などのリレーショナル データベース、IMS などの非リレーショナル データベースなどのファイル システムが含まれています。 点線の矢印は、データ ストア ボックスから、オブジェクト変換というラベルが付いた別のボックスを指しています。 このボックスには、SQL Server Migration Assistant for Db2 などのコンバーターが含まれています。 点線の矢印は、オブジェクト変換ボックスを図の Azure 側のデータ ストレージ ボックスに接続します。 これは、Azure SQL Database や Azure Data Lake Storage などのターゲット データ ストア内の対応するオブジェクトにオブジェクト定義を変換する方法を表します。 ファイル システムとリレーショナル データベースから Azure セルフホステッド統合ランタイムに接続する矢印と、オンプレミスデータ ゲートウェイは、データの取り込みと変換の方法を示します。 矢印は、ファイル転送プロトコルを含むボックスと、SQL Server、Azure Data Factory、および Microsoft Fabric を含む別のボックスに進みます。 矢印は、非リレーショナル データベースをパートナー統合ソリューションに接続します。 矢印は、データ インジェストと変換ボックスをデータ ストレージ ボックスに接続します。 最後に、データ ストレージ ボックスの矢印を使用して、Azure サービスとクライアント アプリに接続します。

このアーキテクチャの Visio ファイルをダウンロードします。

データフロー

次のデータフローは、前の図に対応しています。

  1. メインフレーム システムとミッドレンジ システムは、次のデータ ソースにデータを格納します。

    • ファイル システム:

      • Virtual Storage Access Method (VSAM)
      • フラット ファイル
      • リニア テープ ファイル システム
    • リレーショナル データベース:

      • Db2 for z/OS
      • Db2 for IBM i
      • Db2 for Linux UNIX および Windows
    • 非リレーショナル データベース:

      • 情報管理システム (IMS)
      • Adabas
      • 統合データベース管理システム (IDMS)
  2. オブジェクト変換プロセスは、ソース オブジェクトからオブジェクト定義を抽出します。 その後、定義はターゲット データ ストア内の対応するオブジェクトに変換されます。

    • SQL Server Migration Assistant for Db2 は、スキーマとデータを IBM Db2 データベースから Azure データベースに移行します。

    • マネージド データ プロバイダー for Host Files は、 次の方法でオブジェクトを変換します。

      • 一般的なビジネス指向言語 (COBOL) およびレポート・プログラム・ジェネレーターのレコード・レイアウト、または コピーブックの解析。
      • .NET アプリケーションが使用する C# オブジェクトへのコピーブックのマッピング。
    • Db2toAzurePostgreSQL ツールは、データベース オブジェクトを Db2 から Azure Database for PostgreSQL に移行します。

    • パートナー ツールは、非リレーショナル データベース、ファイル システム、およびその他のデータ ストアに対して自動オブジェクト変換を実行します。

  3. データが取り込まれると変換されます。 メインフレームおよびミッドレンジ システムは、EBCDIC でエンコードされた形式でファイル システム データを次のようなファイル形式で格納します。

    • インデックス付き VSAM ファイル。
    • インデックスのない GDG ファイル。
    • フラット ファイル。

    COBOL、プログラミング言語 1、およびアセンブリ言語のコピーブックは、これらのファイルのデータ構造を定義します。

    ある。 ファイル転送プロトコル (FTP) は、メインフレームとミッドレンジのファイル システム データセットとそれに対応するコピーブックを Azure に転送します。 これらのデータセットには、バイナリ形式で単一のレイアウトとアンパックされたフィールドがあります。

    b。 データ変換は、Host Integration Server のホスト ファイル コンポーネントを使用するか、Azure Logic Apps の IBM ホスト ファイル用の組み込みコネクタを使用して、カスタム プログラムを開発することによって実現されます。

    Spark Notebook コンバーターは、オープンソースの Spark フレームワークを使用して開発されています。 Microsoft Fabric、Azure Synapse Analytics、Azure Databricks などの Spark 環境と互換性があります。

    c. リレーショナル データベース データが移行されます。

    IBM メインフレームおよびミッドレンジ システムは、次のようなリレーショナル データベースにデータを格納します。

    次のサービスは、データベース データを移行します。

    • Azure Data Factory では、Db2 コネクタを使用してデータベースからデータを抽出および統合します。
    • SQL Server Integration Services は、さまざまなデータ 抽出、変換、および読み込みタスクを 処理します。
    • Fabric Data Factory は、IBM Db2 コネクタを使用して Db2 データを移行します。

    d. 非リレーショナル データベース データが移行されます。

    IBM メインフレームおよびミッドレンジ システムは、次のような非リレーショナル データベースにデータを格納します。

    パートナー製品は、これらのデータベースのデータを統合します。

  4. Azure Data Factory や AzCopy などの Azure ツールは、Azure データベースと Azure データ ストレージにデータを読み込みます。 また、パートナー ソリューションとカスタム読み込みソリューションを使用してデータを読み込むこともできます。

  5. Azure では、Azure SQL Database などのフル マネージド リレーショナル データベース サービスや、Azure Cosmos DB などの NoSQL オプションなど、さまざまなデータベース サービスが提供されます。 これらのサービスは、スケーラビリティ、柔軟性、グローバル分散を目的として設計されています。

    また、Azure には、非構造化データ用の Azure Blob Storage や、フル マネージド ファイル共有用の Azure Files など、さまざまなストレージ ソリューションも用意されています。

  6. Azure サービスは、コンピューティング、分析、ストレージ、ネットワークに最新化されたデータ層を使用します。

  7. クライアント アプリケーションでは、最新化されたデータ層も使用されます。

コンポーネント

このアーキテクチャでは、次のコンポーネントを使用します。

データ ストレージ

このアーキテクチャでは、Azure での柔軟でインテリジェントなデータ管理のために、スケーラブルで安全なクラウド ストレージとマネージド データベースにデータを移行する方法について説明します。

  • SQL Database は、 Azure SQL ファミリの一部です。 これはクラウド向けに設計されており、フル マネージドで常緑化されたサービスとしてのプラットフォーム (PaaS) のすべての利点を提供します。 SQL Database は、パフォーマンスと持続性を最適化する、AI を活用した自動機能も備えています。 サーバーレスコンピューティングと ハイパースケールストレージのオプション は、リソースをオンデマンドで自動的にスケーリングします。

  • Azure Database for PostgreSQL は、オープンソースの PostgreSQL データベース エンジンのコミュニティ エディションに基づくフル マネージドのリレーショナル データベース サービスです。

  • Azure Cosmos DB は、グローバルに分散された 複数モデルのNoSQL データベースです。

  • Azure Database for MySQL は、オープンソース の MySQL データベース エンジンのコミュニティ エディションに基づくフル マネージドのリレーショナル データベース サービスです。

  • SQL Managed Instance は、フル マネージドの常緑 PaaS のすべての利点を提供するインテリジェントでスケーラブルなクラウド データベース サービスです。 SQL Managed Instance には、最新の SQL Server Enterprise Edition データベース エンジンとのほぼ完全な互換性があります。 また、一般的なセキュリティの問題に対応するネイティブ仮想ネットワーク実装も提供されます。

  • Azure Data Lake Storage は、ネイティブの生形式で大量のデータを保持するストレージ リポジトリです。 Data Lake Store は、テラバイトとペタバイトのデータにスケーリングするために最適化されています。 通常、データは複数の異種ソースから取得されます。 構造化、半構造化、非構造化のいずれかです。

  • Microsoft Fabric の SQL データベース は、SQL Database に基づく開発者向けのトランザクション データベースです。 これを使用して、Fabric で運用データベースを簡単に作成できます。 Fabric の SQL データベースでは、SQL Database と同じ SQL データベース エンジンが使用されます。

  • Microsoft Fabric Lakehouse は、構造化データと非構造化データを一元的に保存、管理、分析するためのデータアーキテクチャプラットフォームです。

コンピューティング

  • Azure Data Factory は、コンピューティング インフラストラクチャである 統合ランタイム (IR) を使用して、さまざまなネットワーク環境間でデータを統合します。 Azure Data Factory は、セルフホステッド IR を使用して、クラウド データ ストアとオンプレミス ネットワーク内のデータ ストアの間でデータをコピーします。

  • オンプレミス データ ゲートウェイは、ローカルにインストールされた Windows クライアント アプリケーションであり、Microsoft Cloud 内のローカルのオンプレミス データ ソースとサービスの間のブリッジとして機能します。

  • Azure Virtual Machines は、オンデマンドでスケーラブルなコンピューティング リソースを提供します。 Azure 仮想マシン (VM) は、仮想化の柔軟性を提供しますが、物理ハードウェアのメンテナンス要求を排除します。 Azure VM には、Windows や Linux などのオペレーティング システムが用意されています。

データ インテグレーター

このアーキテクチャでは、メインフレーム ソース データとターゲット データベースに応じて使用するさまざまな Azure ネイティブ移行ツールの概要を示します。

  • Azure Data Factory は、ハイブリッド データ統合サービスです。 このソリューションでは、Azure Data Factory はネイティブ コネクタを使用して、Db2 ソースから Azure データベース ターゲットにデータを移行します。

  • AzCopy は、BLOB またはファイルをストレージ アカウントとの間で移動するコマンド ライン ユーティリティです。

  • SQL Server Integration Services は、エンタープライズ レベルのデータ統合および変換ソリューションを作成するためのプラットフォームです。 これを使用すると、次の方法で複雑なビジネス上の問題を解決できます。

    • ファイルのコピーまたはダウンロード。
    • データ ウェアハウスの読み込み。
    • クレンジングとマイニング データ。
    • SQL Server オブジェクトとデータの管理。
  • Host Integration Server の テクノロジとツールは、既存の IBM ホスト システム、プログラム、メッセージ、およびデータを Azure アプリケーションと統合できます。 ホスト ファイル クライアント コンポーネントは、EBCDIC から ASCII に変換されたデータに柔軟性を提供します。 たとえば、変換されたデータから JSON または XML 形式のデータを生成できます。

  • Azure Synapse Analytics は 、データ統合、エンタープライズ データ ウェアハウス、ビッグ データ分析を組み合わせたものになります。 このアーキテクチャでは、Azure Synapse Analytics 変換ソリューションを使用します。 これは Apache Spark に基づいており、大規模なメインフレーム データセット ワークロード変換に適しています。 幅広いメインフレームデータ構造とターゲットをサポートし、コーディング作業を最小限に抑える必要があります。

  • Microsoft Fabric は、エンタープライズ対応のエンド ツー エンドの分析プラットフォームです。 データ移動、データ処理、インジェスト、変換、リアルタイム イベント ルーティング、レポート作成を統合します。 次の統合サービスを使用して、これらの機能をサポートしています。

    • ファブリック データ エンジニア
    • ファブリック データ ファクトリー
    • Fabric Data Science
    • ファブリック Real-Time インテリジェンス
    • ファブリックデータウェアハウス
    • Fabric データベース

その他のツール

  • SQL Server Migration Assistant for Db2 は、Db2 から Microsoft データベース サービスへの移行を自動化します。 このツールを VM 上で実行すると、Db2 データベース オブジェクトが SQL Server データベース オブジェクトに変換され、それらのオブジェクトが SQL Server に作成されます。

  • ホスト ファイルのデータ プロバイダー は、オフライン、SNA、または TCP/IP 接続を使用する Host Integration Server の コンポーネントです。

    • オフライン接続では、データ プロバイダーはローカル バイナリ ファイル内のレコードの読み取りと書き込みを行います。
    • SNA および TCP/IP 接続を使用すると、データ・プロバイダーは、リモート z/OS (IBM Z シリーズのメインフレーム) データセットまたはリモート i5/OS (IBM AS/400 および iSeries システム) 物理ファイルに格納されているレコードを読み取りおよび書き込みます。 TCP/IP を使用するのは i5/OS システムだけです。
  • Azure サービス は、パブリック クラウドで新しいアプリケーションを開発およびスケーリングするための環境、ツール、プロセスを提供します。

シナリオの詳細

Azure データ プラットフォームのような最新のデータ ストレージ ソリューションは、メインフレームおよびミッドレンジ システムよりも優れたスケーラビリティとパフォーマンスを提供します。 システムを最新化することで、これらの利点を活用できます。 ただし、テクノロジ、インフラストラクチャ、プラクティスの更新は複雑です。 このプロセスには、ビジネスとエンジニアリングのアクティビティに関する徹底的な調査が含まれます。 データ管理は、システムを最新化する際の考慮事項の 1 つです。 また、データの視覚化と統合も確認する必要があります。

最新化を成功させるには、 データ優先戦略を使用します。 この方法を使用する場合は、新しいシステムではなくデータに重点を置きます。 データ管理は、モダン化チェックリストの項目に過ぎなくなりました。 代わりに、データが中心になります。 調整された品質指向のデータ ソリューションは、断片化され、管理が不十分なものを置き換えます。

このソリューションでは、データ優先アプローチで Azure データ プラットフォーム コンポーネントを使用します。 具体的には、ソリューションには次のものが含まれます。

  • オブジェクト変換。 オブジェクト定義をソース データ ストアからターゲット データ ストア内の対応するオブジェクトに変換します。

  • データ インジェスト。 ソース データ ストアに接続し、データを抽出します。

  • データ変換。 抽出されたデータを適切なターゲット データ ストア構造に変換します。

  • データ ストレージ。 最初と継続的の両方で、ソース データ ストアからターゲット データ ストアにデータを読み込みます。

考えられるユース ケース

メインフレームおよびミッドレンジ システムを使用する組織は、特に次のような場合に、このソリューションを利用できます。

  • ミッション クリティカルなワークロードを最新化します。

  • ビジネス インテリジェンスを獲得して運用を改善し、競争上の優位性を獲得します。

  • メインフレームとミッドレンジのデータ ストアに関連付けられている高コストと剛性を削除します。

考慮事項

これらの考慮事項では、Azure Well-Architected Framework の柱を実装します。これは、ワークロードの品質を向上させるために使用できる一連の基本原則です。 詳細については、「 Well-Architected Framework」を参照してください。

安全

セキュリティは、意図的な攻撃や貴重なデータとシステムの誤用に対する保証を提供します。 詳細については、「セキュリティの設計レビュー チェックリスト」を参照してください。

コストの最適化

コストの最適化では、不要な経費を削減し、運用効率を向上させる方法に重点を置いています。 詳細については、「コスト最適化の設計レビュー チェックリスト」を参照してください。

  • SQL Server Migration Assistant は、Db2 から SQL Server、SQL Database、SQL Managed Instance へのデータベースの移行を簡略化する、サポートされている無料のツールです。 SQL Server Migration Assistant は、移行評価分析、スキーマと SQL ステートメントの変換、データ移行など、移行のすべての側面を自動化します。

  • Azure Synapse Analytics Spark ベースのソリューションは、オープンソース ライブラリから構築されています。 これにより、ライセンス変換ツールの財務上の負担がなくなります。

  • このソリューションの実装コストを見積もるには、Azure 料金計算ツールを使用します。

パフォーマンス効率

パフォーマンス効率とは、ユーザーの要求を効率的に満たすためにスケーリングするワークロードの能力を指します。 詳細については、「パフォーマンス効率の設計レビュー チェックリスト」を参照してください。

  • パフォーマンス効率の重要な柱は、パフォーマンス管理、容量計画、 スケーラビリティ、適切なパフォーマンス パターンの選択です。

  • アクティブ/アクティブ モードの複数のオンプレミス マシンに論理インスタンスを関連付けることで、 セルフホステッド IR をスケールアウト できます。

  • SQL Database を使用してデータベースを動的にスケーリングします。 サーバーレス層では、コンピューティング リソースを自動的にスケーリングできます。 エラスティック プールを使用すると、データベースはプール内のリソースを共有でき、手動でのみスケーリングできます。

Data Provider for Host Files クライアントを使用してデータを変換する場合は、 接続プールを有効に して接続の起動時間を短縮します。 Azure Data Factory を使用してデータを抽出する場合は、 コピー アクティビティのパフォーマンスを調整します

貢献者達

Microsoft では、この記事を保持しています。 次の共同作成者がこの記事を書きました。

主要著者:

その他の共同作成者:

公開されていない LinkedIn プロフィールを見るには、LinkedIn にサインインしてください。

次のステップ

Azure データベースの移行ガイド」を確認します。 詳細については、 Azure Data Engineering - Mainframe および Midrange Modernization にお問い合わせください。

次の記事をご覧ください。