次の方法で共有


Jupyter Notebooks と Azure Data Studio を使用したビッグ データ クラスターのトラブルシューティング

このページは、SQL Server ビッグ データ クラスターのノートブックのインデックスです。 これらの実行可能ノートブック (.ipynb) は、ビッグ データ クラスターのトラブルシューティングに役立つ SQL Server 2019 用に設計されています。

重要

Microsoft SQL Server 2019 ビッグ データ クラスターのアドオンは廃止されます。 SQL Server 2019 ビッグ データ クラスターのサポートは、2025 年 2 月 28 日に終了します。 ソフトウェア アシュアランス付きの SQL Server 2019 を使用する既存の全ユーザーはプラットフォームで完全にサポートされ、ソフトウェアはその時点まで SQL Server の累積更新プログラムによって引き続きメンテナンスされます。 詳細については、お知らせのブログ記事と「Microsoft SQL Server プラットフォームのビッグ データ オプション」を参照してください。

各ノートブックは、独自の依存関係を確認するように設計されています。 [ すべてのセルを実行 ] オプションが正常に完了するか、別のノートブックにハイパーリンクされた ヒント を含む例外を発生させ、不足している依存関係を解決します。 ヒントのハイパーリンクに従ってターゲット ノートブックに移動し、[ すべてのセルを実行] をクリックします。 成功したら、元のノートブックに戻り、[ すべてのセルを実行] をクリックします。

すべての依存関係がインストールされたが、 すべてのセルを実行 すると失敗すると、各ノートブックは結果を分析し、可能な場合は別のノートブックへのハイパーリンクヒントを生成して、問題の解決に役立ちます。

ビッグ データ クラスターのトラブルシューティング

このセクションには、SQL Server ビッグ データ クラスターからログを取得するための一連のノートブックが含まれています。

名前 説明
TSG100 - ビッグ データ クラスターのトラブルシューティング ツール ビッグ データ クラスターの問題のトラブルシューティングに関して利用可能なすべてのノートブックの概要と、それらを使用するタイミング
TSG101 - SQL Server トラブルシューティング ツール SQL Server の問題のトラブルシューティングと使用するタイミングに関する利用可能なすべてのノートブックの概要
TSG102 - HDFS トラブルシューティング ツール HDFS の問題のトラブルシューティングに関するすべての利用可能なノートブックの概要と、それらを使用するタイミング
TSG103 - Spark トラブルシューティング ツール Spark の問題のトラブルシューティングと使用するタイミングに関する利用可能なすべてのノートブックの概要
TSG104 - コントロールのトラブルシューティング ツール コントローラーの問題のトラブルシューティングと使用するタイミングに関する利用可能なすべてのノートブックの概要
TSG105 - ゲートウェイのトラブルシューティング ツール Knox Gateway の問題のトラブルシューティングに関する利用可能なすべてのノートブックの概要と、それらを使用するタイミング
TSG106 - アプリのトラブルシューティング ツール App-Deploy の問題のトラブルシューティングと使用するタイミングに関する利用可能なすべてのノートブックの概要

ビッグ データ クラスターからの問題を診断する

ビッグ データ クラスターを使用して状況と状態を診断するための一連のノートブック。

名前 説明
TSG002 - CrashLoopBackoff この TSG は、"実行中" 状態への最後の試行が失敗した各コンテナーに接続し、現在および以前のコンテナー ログを取得します。 これは、kubectl get ポッドで報告された CrashLoopBackOff の問題をデバッグする場合に役立ちます。
TSG025 - FSM ブラウザー - クエリーコントローラー FSM 状態 このノートブックを使用してコントローラー データベースに接続し、有限状態マシン (FSM) の状態を参照します。 このノートブックを使用して、アクティブなステート マシンを一覧表示し、スタックしているワークフローを特定します。
TSG026 - データ プール ノードに接続する (T-SQL を実行する) このノートブックを使用してデータ プール ノードに接続する (T-SQL を実行する)
TSG027 - クラスターのデプロイを観察する このノートブックを使用してクラスターのデプロイを観察します。SQL Server ビッグ データ クラスターの作成に関する問題をトラブルシューティングするためのガイダンスを提供します。次のコマンドは、多くの場合、基になる原因を特定するのに役立ちます。
TSG029 - クラスター内のダンプを検索する このノートブックを使用して、SQL Server やビッグ データ クラスター内のコントローラーなどのプロセスからコアダンプとミニダンプを検索します。
TSG032 - すべてのコンテナーの CPU とメモリの使用量 このノートブックを使用して、すべてのコンテナーの CPU とメモリの使用量を確認します。
TSG037 - プライマリ レプリカをホストしているマスター プール ポッドを決定する このノートブックを使用して、マスター プールの高可用性が有効になっているときにビッグ データ クラスターのプライマリ レプリカをホストするマスター プール ポッドを決定します。
TSG044 - マスター プール コンテナーで sqlcmd を実行する このノートブックを使用して、T-SQL 経由でマスター プール ノードに直接接続します。
TSG055 - タイムカールからスパークヘッドへ このノートブックを使用して、コントローラー ポッドから Sparkhead ポッドへの Curl 応答時間を理解するための手順を診断します。
TSG060 - すべてのビッグ データ クラスター PVC の永続ボリューム ディスク領域 このノートブックを使用して、各コンテナーに接続し、ビッグデータクラスター内の各永続ボリューム要求 (PVC) にマップされた永続ボリューム (PV) の使用中または使用可能なディスク領域を取得します。
TSG078 - クラスターが正常かどうか このノートブックを使用して、ビッグ データ クラスターが正常かどうかを確認します。
TSG079 - コントローラー コア ダンプの生成 このノートブックを使用して、コントローラー コア ダンプを生成します。
TSG086 - すべてのコンテナーでtopを実行する このノートブックを使用して、すべてのコンテナーでトップを実行します。
TSG087 - namenode ポッドで hadoop fs CLI を使用する このノートブックを使用して、namenode ポッドで hadoop fs CLI を使用します。
TSG108 - コントローラーのアップグレード構成マップを表示する このノートブックを使用して、 azdata bdc アップグレードを使用してビッグ データ クラスターのアップグレードを実行するときのエラーのトラブルシューティングを行います。
TSG112 - Active Directory の展開前チェック このノートブックを使用して、ビッグ データ クラスターの構成が Active Directory 展開に対して有効であることを検証します。
TSG115 - SQL Server on Linux セキュリティ ログ トランスレーター このノートブックを使用して、SQL Server on Linux の security.ldap ロガーと security.kerberos ロガーによって生成されたログを解析します。 これらのロガーを有効にするには、SQL Server on Linux を実行しているマシンの /var/opt/mssql/logger.ini に以下の行を配置します。 注: このファイルでは大文字と小文字が区別されます。
TSG116 - SQL BDC セキュリティ サポート ログ トランスレーター このノートブックを使用して、SQL BDC のセキュリティ サポート サービスによって生成されたログを解析します。 ログを取得するには、クラスターからデバッグ ログをコピーして抽出します。 次の手順に従います。 "azdata bdc debug copy-logs -n < namespace>" を実行します。これにより、いくつかの.tar.gz ファイルが作成されます。debuglogs-<namespace>-<date>-<time>.tar.gz - ./<namespace>/control-< に格納されているセキュリティ サポート ログを見つけます。...>/security-support/supervisol/log/secsupp-stderr---<...>。丸太。
TSG119 - Active Directory の展開後のチェック このノートブックは、AD デプロイ後に BDC 構成を検証するように設計されています。 dnsName 属性を持つすべてのエンドポイントの DNS エントリの存在を確認します。これらの DNS エントリは、エイリアスではなくホスト レコード (つまり、CNAME レコードではないレコード) にする必要があります。また、よく知られている AD アカウントの存在と、それらが有効になっているかどうか、および予期される SPN の存在

ビッグ データ クラスターからの問題を修復する

SQL Server ビッグ データ クラスターの既知の状況と状態を修復するための一連のノートブック。

名前 説明
TSG005 - 転送ループが検出されました このノートブックを使用して、ユーティリティ dnsmasq が resolv.conf にローカル ループバックを配置できるため、検出された転送ループを処理します。これにより、コントローラー ポッドが初期クラスターのデプロイ中に CrashLoopBackOff に入る可能性があります: https://askubuntu.com/questions/627899/nameserver-127-0-1-1-in-resolv-conf-wont-go-away|
TSG011 - sparkhistory サーバーを再起動する sparkhistory java プロセスは起動時に応答を停止する可能性があるため、このノートブックを使用して sparkhistory サーバーを再起動します。 sparkhistory サーバーを再起動すると (supervisorctl restart sparkhistory)、この問題が解決する可能性があります。
TSG018 - マスター プールで sqlservr プロセスを強制終了する T-SQL SHUTDOWN が ./sqlservr プロセスを正常に再循環できない場合は、このノートブックを使用します。 このノートブックを使用して、./sqlservr フロントエンド プロセスによって自動的に再起動されるメイン sqlservr プロセスを強制終了します。
TSG024 - Namenode がセーフ モードです HDFS 自体がセーフ モードになる場合は、このノートブックを使用します。 たとえば、記憶域プールで再循環が速すぎるポッドが多すぎる場合は、セーフ モードが自動的に有効になる可能性があります。
TSG028 - すべての記憶域プール ノードでノード マネージャーを再起動する このノートブックは、すべての記憶域プール ノードでノード マネージャーを再起動する必要がある場合に使用します。
TSG038 - 文書にキーがないためBDC作成に失敗しました このノートブックは、ドキュメントにキーがないために BDC でエラーが発生した場合に使用します。
TSG039 - 無効なオブジェクト名 'role_permissions' Knox gateway.logのロールアクセス許可が原因で無効なオブジェクトの問題が発生した場合は、このノートブックを使用します
TSG040 - エラーが発生したコントローラーからファイル名を取得できませんでした このノートブックは、コントローラーからファイル名を取得するときに 504 ゲートウェイがタイムアウトする場合に使用します。
TSG041 - 新しい非同期 I/O コンテキストを作成できません (sysctl fs.aio-max-nr を増やす) 新しい非同期 I/O コンテキストを作成できない場合 (sysctl fs.aio-max-nr を増やす) には、このノートブックを使用します。
TSG045 - このサイズの VM に接続できるデータ ディスクの最大数 (AKS) このサイズ (AKS) の VM に接続できるデータ ディスクの最大数がある場合は、このノートブックを使用します。
TSG047 - ConfigException - 名前を持つオブジェクトが 1 つだけ必要です 名前を持つオブジェクトが 1 つだけ必要な ConfigException がある場合は、このノートブックを使用します。
TSG048 - "コントローラー ポッドが稼働するのを待機しています" でデプロイが停止する デプロイメントが「コントローラーのポッドが起動を待機中です」で停止した場合に、このノートブックを使用します。
TSG050 - クラスターの作成が停止し、「ポッドに対するボリュームのアタッチまたはマウントの待機中にタイムアウトが発生しました」 クラスターの作成が「ポッドに対するボリュームのアタッチまたはマウントを待機中にタイムアウトが切れた」と表示されてハングする場合、このノートブックを使用します。
TSG052 - master-svc DNS を取得しようとしましたが失敗し、再試行されます クラスターの作成が「ポッドに対するボリュームのアタッチまたはマウントを待機中にタイムアウトが切れた」と表示されてハングする場合、このノートブックを使用します。
TSG057 - コントローラー サービスを開始するときに失敗しました。System.TimeoutException このノートブックは、コントローラー サービスの開始時や、System.TimeoutException に直面した時に使用します。
TSG067 - kube 構成のセットアップを完了できませんでした kube 構成のセットアップを完了できない場合は、このノートブックを使用します。
TSG074 - App-Deploys の削除 ビッグ データ クラスターでアプリを削除する際に問題が発生した場合は、このノートブックを使用します。
TSG075 - ネットワークプラグイン cni の失敗によりポッドの設定に失敗し、FailedCreatePodSandBox NetworkPlugin cni がポッドのセットアップに失敗したために FailedCreatePodSandBox 例外が発生した場合は、このノートブックを使用します。
TSG080 - azdata を使用して Spark セッションを削除する Spark セッションの削除中に問題が発生する場合は、このノートブックを使用します。
TSG109 - アップグレード タイムアウトの設定 BDCのアップグレード関連の問題が発生した際に、このノートブックを活用してください。
TSG110 - Azdata が ApiError を返す Azdata が ApiError を返す場合は、このノートブックを使用します。

次のステップ

ビッグ データ クラスターの詳細については、「 SQL Server ビッグ データ クラスターとは」を参照してください。