頂点実行ビューを使用して Data Lake Analytics ジョブを試験する方法について説明します。
重要
Azure Data Lake Analytics は 2024 年 2 月 29 日に廃止されました。 このお知らせで詳細を学びましょう。
データ分析の場合、組織は Azure Synapse Analytics または Microsoft Fabric を使用できます。
頂点実行ビューを開く
Data Lake Tools for Visual Studio で U-SQL ジョブを開きます。 左下隅にある [頂点実行ビュー ] を選択します。 最初にプロファイルを読み込むよう求められる場合があり、ネットワーク接続によっては時間がかかる場合があります。
頂点実行ビューを理解する
頂点実行ビューには、次の 3 つの部分があります。
左側の 頂点セレクター を使用すると、フィーチャごとに頂点を選択できます (上位 10 個のデータ読み取り、ステージ別の選択など)。 最も一般的に使用されるフィルターの 1 つは、 クリティカル パス上の頂点を表示する方法です。 クリティカル パスは、U-SQL ジョブの頂点の最も長いチェーンです。 クリティカル パスを理解することは、最も時間がかかる頂点を確認してジョブを最適化するのに役立ちます。
上部中央のウィンドウには、 すべての頂点の実行中の状態が表示されます。
下部中央のペインには、各頂点に関する情報が表示されます。
- プロセス名: 頂点インスタンスの名前。 ステージ名、バーテックス名、バーテックスランインスタンスのさまざまな部分で構成されています。 たとえば、SV7_Split[62].v1 頂点は、ステージ SV7_Splitの頂点番号 62 の 2 番目の実行中のインスタンス (.v1、0 から始まるインデックス) を表します。
- 読み取り/書き込まれたデータの合計: この頂点によってデータが読み書きされました。
- 状態/終了状態: 頂点が終了したときの最終的な状態。
- 終了コード/エラーの種類: 頂点が失敗したときのエラー。
- 作成理由: 頂点が作成された理由。
- リソース待機時間/プロセス待機時間/PN キュー待機時間: 頂点がリソースを待機し、データを処理し、キューに留まるのにかかった時間。
- プロセス/クリエーター GUID: 現在実行中の頂点またはその作成者の GUID。
- バージョン: 実行中の頂点の N 番目のインスタンス (システムは、フェールオーバー、コンピューティング冗長性など、さまざまな理由で頂点の新しいインスタンスをスケジュールする場合があります)
- バージョンの作成時刻。
- プロセス作成開始時刻/プロセスキュー時間/プロセス開始時刻/プロセス完了時間:頂点プロセスの作成が開始されたとき。頂点プロセスがキューに入り始めるとき。特定の頂点プロセスが開始されたとき。特定の頂点が完了したとき。
次のステップ
- 診断情報をログに記録するには、Azure Data Lake Analytics の診断ログへのアクセスに関するページを参照してください。
- より複雑なクエリを表示する場合は、「 チュートリアル: Azure Data Lake Analytics を使用して Web サイトのログを分析する」をご覧ください。
- ジョブの詳細を表示するには、「Azure Data Lake Analytics ジョブのジョブ ブラウザーとジョブ ビューを使用する」を参照してください。