DP-100日本語試験無料問題集「Microsoft Designing and Implementing a Data Science Solution on Azure (DP-100日本語版) 認定」

ホットスポットに関する質問
Python SDK v2 を使用して Azure Machine Learning ワークスペースを管理します。
Parquet 形式で保存されたデータ ファイルを使用して分類モデルを生成するには、自動化された機械学習ジョブを作成する必要があります。
ジョブの自動スケーリング コンピューティング ターゲットとデータ アセットを構成する必要があります。
ジョブのリソースを構成する必要があります。
どのリソース構成を使用する必要がありますか? 回答するには、回答領域で適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。
正解:

Explanation:
Compute target: Azure Databricks
This is because Azure Databricks supports autoscaling of workers required to run your job, which dynamically reallocates workers to match the computational demands of your job, thereby achieving high cluster utilization without the need for provisioning the cluster to match a specific workload.
Data asset: uri_folder
This option allows the machine learning job to access all the Parquet files stored in the specified directory. If you have multiple Parquet data files, you would use a URI that points to a folder containing all these files.
ドラッグアンドドロップの質問
群衆感情モデルの評価戦略を定義する必要があります。
どの 3 つのアクションを順番に実行する必要がありますか? 回答するには、アクション リストから適切なアクションを回答領域に移動し、正しい順序で並べます。
正解:

Explanation:
Scenario:
Experiments for local crowd sentiment models must combine local penalty detection data. Crowd sentiment models must identify known sounds such as cheers and known catch phrases.
Individual crowd sentiment models will detect similar sounds.
Note: Evaluate the changed in correlation between model error rate and centroid distance In machine learning, a nearest centroid classifier or nearest prototype classifier is a classification model that assigns to observations the label of the class of training samples whose mean (centroid) is closest to the observation.
References:
https://en.wikipedia.org/wiki/Nearest_centroid_classifier
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/sweep- clustering
ドラッグアンドドロップの質問
Workspace1 という名前の Azure Machine Learning ワークスペースを管理します。
次の registry.yml を使用して、registry01 という名前のレジストリを作成する予定です (行番号は参照のみに使用されます)。

ワークスペース 1 と対話するには、ノートブックで Azure Machine Learning Python SDK v2 と Python 3.10 を使用する必要があります。
どの 3 つのアクションを順番に実行する必要がありますか? 回答するには、アクション リストから適切なアクションを回答領域に移動し、正しい順序で並べます。
正解:
ローカルマシン上で機械学習プロジェクトを開発します。
このプロジェクトでは、Azure Machine Learning SDK for Python を使用します。
スクリプトのバージョン管理として Git を使用します。
Run オブジェクトを返すトレーニング実行を送信します。
トレーニング実行のためにアクティブな Git ブランチを取得する必要があります。
どの 2 つのコード セグメントを使用する必要がありますか? それぞれの正解はソリューションの一部を示しています。
注意: 正しい選択ごとに 1 ポイントが付与されます。

解説: (GoShiken メンバーにのみ表示されます)
ホットスポットに関する質問
STANDARD_D1 仮想マシン イメージを使用して、ComputeOne という名前の Azure Machine Learning コンピューティング ターゲットを作成します。
Azure Machine Learning ワークスペースを参照する was という名前の Python 変数を定義します。次の Python コードを実行します。

次の各文について、正しい場合は「はい」を選択してください。そうでない場合は「いいえ」を選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。
正解:

Explanation:
Box 1:Yes
ComputeTargetException class: An exception related to failures when creating, interacting with, or configuring a compute target. This exception is commonly raised for failures attaching a compute target, missing headers, and unsupported configuration values.
Create(workspace, name, provisioning_configuration)
Provision a Compute object by specifying a compute type and related configuration.
This method creates a new compute target rather than attaching an existing one.
Box 2: Yes
Box 3: No
The line before print('Step1') will fail.
Reference:
https://docs.microsoft.com/en-us/python/api/azureml-core/azureml.core.compute.computetarget
注: この質問は、同じシナリオを提示する一連の質問の一部です。一連の質問にはそれぞれ、定められた目標を満たす独自の解決策が含まれています。質問セットによっては、正しい解決策が複数ある場合もあれば、正しい解決策がない場合もあります。
このセクションの質問に回答した後は、その質問に戻ることはできません。そのため、これらの質問はレビュー画面に表示されません。
Azure Machine Learning モデルをトレーニングして登録します。
モデルをオンライン エンドポイントにデプロイする予定です。
アプリケーションが、有効期限のないアーティファクトを使用した認証方法を使用してモデルにアクセスできるようにする必要があります。
解決策: デフォルトの認証設定を使用して、管理されたオンライン エンドポイントを作成します。モデルをオンライン エンドポイントにデプロイします。
ソリューションは目標を満たしていますか?

解説: (GoShiken メンバーにのみ表示されます)
あなたは銀行で働いているデータサイエンティストであり、Azure MLを使用して、顧客がローンを返済する可能性が高いかどうかを予測する機械学習モデルをトレーニングして登録しました。
モデルがどのように選択を行っているかを理解し、モデルが申請者の居住地に基づいてローンを拒否するなどの政府の規制に違反しないことを確認する必要があります。
顧客データの各機能が予測にどの程度影響を与えているかを判断する必要があります。
あなたは何をするべきか?

解説: (GoShiken メンバーにのみ表示されます)
注:この質問は、同じシナリオを提示する一連の質問の一部です。シリーズの各質問には、述べられた目標を達成する可能性のある独自の解決策が含まれています。一部の質問セットには複数の正しい解決策がある場合がありますが、他の質問セットには正しい解決策がない場合があります。
このセクションの質問に回答した後は、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
Pythonスクリプトを使用して、Azure MachineLearningの実験を実行することを計画しています。スクリプトは、実験実行コンテキストへの参照を作成し、ファイルからデータをロードし、ラベル列の一意の値のセットを識別して、実験実行を完了します。
azureml.coreからインポート実行
パンダをpdとしてインポートする
run = Run.get_context()
データ= pd.read_csv( 'data.csv')
label_vals = data ['label']。unique()
#ここに指標を記録するコードを追加
run.complete()
実験では、後で確認できる実行のメトリックとして、データ内の一意のラベルを記録する必要があります。
コメントで示されたポイントで実行メトリックとして一意のラベル値を記録するには、スクリプトにコードを追加する必要があります。
解決策:コメントを次のコードに置き換えます。
run.log_table( 'ラベル値'、label_vals)
ソリューションは目標を達成していますか?

解説: (GoShiken メンバーにのみ表示されます)
ホットスポットに関する質問
近くの気象観測所からデータを収集します。次のデータを含む weather_df という名前の pandas データフレームがあります。

データは正午と深夜の 12 時間ごとに収集されます。
自動化された機械学習を使用して、今後 7 日間の気温を予測する時系列モデルを作成する予定です。トレーニングの最初のラウンドでは、最大 50 個の異なるモデルをトレーニングします。
これらのモデルをトレーニングするには、Azure Machine Learning SDK v2 を使用して自動化された機械学習実験を実行する必要があります。
自動化された機械学習ジョブとその設定を構成する必要があります。
ジョブを実装するクラスのパラメータをどのように構成すればよいでしょうか? 回答するには、回答領域で適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。
正解:
ドラッグアンドドロップの質問
Spark プールを使用して、Azure Machine Learning ワークスペースと Azure Synapse Analytics ワークスペースを作成します。ワークスペースは同じ Azure サブスクリプション内に含まれます。
Synapse Spark プールは、Azure Machine Learning ワークスペースから管理する必要があります。
Python SDK v2 を使用して、Azure Machine Learning に Synapse Spark プールをアタッチする必要があります。
どの 3 つのアクションを順番に実行する必要がありますか? 回答するには、アクション リストから適切なアクションを回答領域に移動し、正しい順序で並べます。
正解:
ある組織が、ラベル付きの写真のセットを使用するマルチクラス画像分類ディープラーニング モデルを作成して展開します。
ソフトウェア エンジニアリング チームは、夏季に予測 Web サービスの推論負荷が大きくなると報告しています。Web サービスが展開されているコンピューティング クラスターが完全に使用されているにもかかわらず、モデルの運用 Web サービスは需要を満たすことができません。
最小限のダウンタイムと最小限の管理労力で、画像分類 Web サービスのパフォーマンスを向上させる必要があります。
IT 運用チームに何をアドバイスすべきでしょうか?

解説: (GoShiken メンバーにのみ表示されます)
ドラッグアンドドロップの質問
広告応答のモデリング戦略を定義する必要があります。
どの 3 つのアクションを順番に実行する必要がありますか? 回答するには、アクション リストから適切なアクションを回答領域に移動し、正しい順序で並べます。
正解:

Explanation:
Step 1: Implement a K-Means Clustering model
Step 2: Use the cluster as a feature in a Decision jungle model.
Decision jungles are non-parametric models, which can represent non-linear decision boundaries.
Step 3: Use the raw score as a feature in a Score Matchbox Recommender model The goal of creating a recommendation system is to recommend one or more "items" to "users" of the system. Examples of an item could be a movie, restaurant, book, or song. A user could be a person, group of persons, or other entity with item preferences.
Scenario:
Ad response rated declined.
Ad response models must be trained at the beginning of each event and applied during the sporting event.
Market segmentation models must optimize for similar ad response history.
Ad response models must support non-linear boundaries of features.
References:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/multiclass- decision-jungle
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/score- matchbox-recommender
Azure Machine Learning SDK for Python を使用して、2 段階の Azure Machine Learning パイプラインを開発しています。
実行が完了したら、パイプラインの出力を名前付きデータセットの新しいバージョンとして登録する必要があります。
何を実装すべきでしょうか?

解説: (GoShiken メンバーにのみ表示されます)
機密データを含むデータセットがあります
a。データセットを使用してモデルをトレーニングします。
個人のデータを安全かつプライベートに保つには、差分プライバシーパラメータを使用する必要があります。
集計結果に対するユーザーデータの影響を減らす必要があります。
あなたは何をするべきか?

解説: (GoShiken メンバーにのみ表示されます)
特徴抽出方法を選択する必要があります。
どちらの方法を使用すべきでしょうか?

解説: (GoShiken メンバーにのみ表示されます)
Azure Machine Learning ワークスペースがあります。
モデルをトレーニングするときに、モデルのハイパーパラメーターを調整することを計画します。
正規分布値を返す検索スペースを定義する必要があります。
どのパラメータを使用する必要がありますか?

解説: (GoShiken メンバーにのみ表示されます)
ホットスポットに関する質問
Azure Machine Learning デザイナーを使用して、すべての国の国勢調査データを含むデータセットを変換します。
データセットを 2 つのデータセットに分割するには、Split Data コンポーネントを使用する必要があります。最初のデータセットには、米国の国勢調査データが含まれている必要があります。2 番目のデータセットには、残りの国の国勢調査データが含まれている必要があります。
データセットを作成するには、コンポーネントを構成する必要があります。
どの設定値を使用する必要がありますか? 回答するには、回答領域で適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。
正解: