DP-100日本語試験無料問題集「Microsoft Designing and Implementing a Data Science Solution on Azure (DP-100日本語版) 認定」

Azure Machine Learning SDK v2、Python、ノートブックを使用してモデルをトレーニングします。Pythonコードを使用して、コンピューティング先、環境、そしてトレーニングスクリプトを作成します。トレーニングジョブを送信するための情報を準備する必要があります。
どのクラスを使用すべきでしょうか?

2クラスのロジスティック回帰モデルを使用して、バイナリ分類を作成しています。
不均衡のモデル結果を評価する必要があります。
どの評価基準を使用する必要がありますか?

解説: (GoShiken メンバーにのみ表示されます)
注:この質問は、同じシナリオを提示する一連の質問の一部です。シリーズの各質問には、記載された目標を達成する可能性のある独自のソリューションが含まれています。一部の質問セットには複数の正しい解決策がある場合もあれば、正しい解決策がない場合もあります。
このセクションの質問に回答すると、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
複数の列に欠損値を含む数値データセットを分析しています。
機能セットの次元に影響を与えることなく、適切な操作を使用して欠損値を消去する必要があります。
すべての値を含めるには、完全なデータセットを分析する必要があります。
解決策:欠落しているデータポイントを含む列全体を削除します。
ソリューションは目標を達成していますか?

解説: (GoShiken メンバーにのみ表示されます)
あなたはワイナリーにデータサイエンティストとして採用されました。前職のデータサイエンティストはAzure Machine Learningを使用していました。
モデルを確認し、各モデルがどのように決定を下すかを説明する必要があります。
どの説明モジュールを使用すればよいですか? 回答するには、回答エリアで適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。
正解:

Reference:
https://medium.com/microsoftazure/automated-and-interpretable-machine-learning-d07975741298
TensorFlow を使用してディープラーニング モデルを開発しています。Azure Machine Learning コンピューティング インスタンスでモデルのトレーニング ワークロードを実行する予定です。
CUDA ベースのモデルトレーニングを使用する必要があります。
コンピューティング インスタンスをプロビジョニングする必要があります。
使用できる仮想マシンのサイズは 2 つあります。回答するには、回答領域で適切な仮想マシンのサイズを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。
正解:

Reference:
https://www.infoworld.com/article/3299703/what-is-cuda-parallel-programming-for-gpus.html
Azure Machine Learning デザイナーを使用してトレーニング パイプラインを作成します。データのインポート コンポーネントを使用して、機械学習パイプラインにデータを読み込む必要があります。どの 2 つのデータ ソースを使用できますか?それぞれの正解は完全な解答を示しています。
注: 正解ごとに1ポイント獲得

機械学習ワークフローを自動化プロセスとして設定します。Azure Machine Learning ワークスペースを含む Azure サブスクリプションの所有者ロールを付与します。
ユーザーの操作を必要とせずに、自動化されたプロセスがワークスペースに対して認証できるようにする認証方法を設定する必要があります。
Azure Machine Learning ワークスペースの認証を設定する必要があります。
どの 3 つの認証手順を順番に実行する必要がありますか? 回答するには、適切な認証手順を認証手順のリストから回答領域に移動し、正しい順序に並べます。
注:正解の選択肢の順序は複数あります。正解の選択肢のいずれを選択しても、得点が加算されます。
正解:
分類タスクに取り組んでいます。ある生徒がサッカーをしたいかどうか、および関連する属性を示すデータセットがあります。データセットには以下の列が含まれています。
変数をタイプ別に分類する必要があります。
各カテゴリにどの変数を追加する必要がありますか? 回答するには、回答領域で適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。
正解:

Reference:
https://www.edureka.co/blog/classification-algorithms/
Azure Machine Learning を使用して機械学習モデルをトレーニングします。トレーニング スクリプトをリモートで実行するためのコンピューティング先が必要です。次の Python コードを実行します。

正解:

Reference:
https://docs.microsoft.com/en-us/python/api/azureml-core/azureml.core.compute.amlcompute.amlcomputeprovisioningconfiguration
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-create-attach-compute-studio
デザイナを使用して、分類モデルのトレーニングパイプラインを作成します。パイプラインは、モデルのトレーニングに必要な機能とラベルを含むデータセットを使用します。
トレーニングパイプラインからリアルタイムの推論パイプラインを作成します。生成されたWebサービス入力のスキーマがデータセットに基づいており、モデルが予測するラベル列が含まれていることがわかります。サービスを使用するクライアントアプリケーションは、この値を送信する必要はありません。
要件を満たすために、推論パイプラインを変更する必要があります。
あなたは何をするべきか?

解説: (GoShiken メンバーにのみ表示されます)
Azure Machine Learning Studioの2クラスニューラルネットワークモジュールを使用して、バイナリ分類モデルを構築します。 Tune Model Hyperparametersモジュールを使用して、モデルの精度を調整します。
Tune Model Hyperparametersモジュールを使用して、調整する必要があるハイパーパラメーターを選択する必要があります。
どの2つのハイパーパラメーターを使用する必要がありますか?それぞれの正解はソリューションの一部を示しています。
注:それぞれの正しい選択には1ポイントの価値があります。

解説: (GoShiken メンバーにのみ表示されます)
様々な都市における住宅所有に関する人口統計データを調査する予定です。データは、以下の形式のCSVファイルです。
年齢、都市、収入、住宅所有者
21,シカゴ,50000,0
35,シアトル,120000,1
23,シアトル,65000,0
45,シアトル,130000,1
18,シカゴ,48000,0
Azure Machine Learning ワークスペースで実験を実行し、データを探索して結果をログに記録する必要があります。実験では以下の情報をログに記録する必要があります。
データセット内の観測数
住宅所有者別の収入の箱ひげ図
都市名と各都市の平均収入を含む辞書。必要な情報を記録するには、実験の実行オブジェクトの適切なログ記録方法を使用する必要があります。
コードをどのように完成させるべきでしょうか? 回答するには、適切なコード セグメントを正しい場所にドラッグします。
各コードセグメントは、1回、複数回、またはまったく使用されない場合があります。コンテンツを表示するには、ペイン間の分割バーをドラッグするか、スクロールする必要がある場合があります。
注意: 正しい選択ごとに 1 ポイントが付与されます。
正解:
Azure Machine Learning ワークスペースを管理しています。scriptpy という Pylhon スクリプトは、training_data という引数を読み取ります。trainlng.data 引数は、datasetl というファイル内のトレーニングデータへのパスを指定します。
csv。
機械学習モデルをトレーニングするコマンド ジョブとして scriptpy Python スクリプトを実行する予定です。
スクリプトをトレーニング ジョブとして送信するときに、データ スクリプトのパスをパラメーター値として渡すコマンドを指定する必要があります。
解決策: python script.py -training_data ${{inputs,training_data}}
ソリューションは目標を満たしていますか?

群衆感情モデルの評価戦略を定義する必要があります。
順番に実行する必要がある 3 つのアクションはどれですか。回答するには、適切なアクションをアクション リストから回答領域に移動し、正しい順序に並べます。
正解:

1 - Define a cross-entropy function activation
2 - Add cost functions for each target state.
3 - Evaluated the distance error metric.
Reference:
https://www.analyticsvidhya.com/blog/2018/04/fundamentals-deep-learning-regularization-techniques/