100%無料Microsoft Azure DP-100日本語問題集PDFお試しサンプル認定ガイドカバー率 [Q88-Q106]

Share

100%無料Microsoft Azure DP-100日本語問題集PDFお試しサンプル認定ガイドカバー率

PDF試験材料2024年最新の実際に出るDP-100日本語問題集

質問 # 88
AccessibilityToHighway列の欠落データを置き換える必要があります。
Clean Missing Dataモジュールをどのように構成する必要がありますか?回答するには、回答エリアで適切なオプションを選択します。
注:それぞれの正しい選択には1ポイントの価値があります。

正解:

解説:

Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/clean-missing-data


質問 # 89
モデルのトレーニング要件に従って、順列機能の重要度モジュールを設定する必要があります。
どのプロパティを選択する必要がありますか?回答するには、回答エリアで適切なオプションを選択します。
注:それぞれの正しい選択には1ポイントの価値があります。

正解:

解説:

Explanation

Box 1: Accuracy
Scenario: You want to configure hyperparameters in the model learning process to speed the learning phase by using hyperparameters. In addition, this configuration should cancel the lowest performing runs at each evaluation interval, thereby directing effort and resources towards models that are more likely to be successful.
Box 2: R-Squared


質問 # 90
広告応答のモデリング戦略を定義する必要があります。
順番に実行する必要がある3つのアクションはどれですか?回答するには、適切なアクションをアクションのリストから回答エリアに移動し、正しい順序に並べます。

正解:

解説:

1 - Implement a K-Means Clustering model
2 - Use the cluster as a feature in a Decision jungle model.
3 - Use the raw score as a feature in a Score Matchbox Recommender model Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/multiclass-decision-jungle
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/score-matchbox-recommender
Topic 2, Overview
Datasets
There are two datasets in CSV format that contain property details for two cities, London and Paris, with the following columns:

The two datasets have been added to Azure Machine Learning Studio as separate datasets and included as the starting point of the experiment.
Dataset issues
The AccessibilityToHighway column in both datasets contains missing values. The missing data must be replaced with new data so that it is modeled conditionally using the other variables in the data before filling in the missing values.
Columns in each dataset contain missing and null values. The dataset also contains many outliers. The Age column has a high proportion of outliers. You need to remove the rows that have outliers in the Age column. The MedianValue and AvgRoomsinHouse columns both hold data in numeric format. You need to select a feature selection algorithm to analyze the relationship between the two columns in more detail.
Model fit
The model shows signs of overfitting. You need to produce a more refined regression model that reduces the overfitting.
Experiment Requirements
You must set up the experiment to cross-validate the Linear Regression and Bayesian Linear Regression modules to evaluate performance.
In each case, the predictor of the dataset is the column named MedianValue. An initial investigation showed that the datasets are identical in structure apart from the MedianValue column. The smaller Paris dataset contains the MedianValue in text format, whereas the larger London dataset contains the MedianValue in numerical format. You must ensure that the datatype of the MedianValue column of the Paris dataset matches the structure of the London dataset.
You must prioritize the columns of data for predicting the outcome. You must use non-parameters statistics to measure the relationships.
You must use a feature selection algorithm to analyze the relationship between the MedianValue and AvgRoomsinHouse columns.
Model training
Given a trained model and a test dataset, you need to compute the permutation feature importance scores of feature variables. You need to set up the Permutation Feature Importance module to select the correct metric to investigate the model's accuracy and replicate the findings.
You want to configure hyperparameters in the model learning process to speed the learning phase by using hyperparameters. In addition, this configuration should cancel the lowest performing runs at each evaluation interval, thereby directing effort and resources towards models that are more likely to be successful.
You are concerned that the model might not efficiently use compute resources in hyperparameter tuning. You also are concerned that the model might prevent an increase in the overall tuning time. Therefore, you need to implement an early stopping criterion on models that provides savings without terminating promising jobs.
Testing
You must produce multiple partitions of a dataset based on sampling using the Partition and Sample module in Azure Machine Learning Studio. You must create three equal partitions for cross-validation. You must also configure the cross-validation process so that the rows in the test and training datasets are divided evenly by properties that are near each city's main river. The data that identifies that a property is near a river is held in the column named NextToRiver. You want to complete this task before the data goes through the sampling process.
When you train a Linear Regression module using a property dataset that shows data for property prices for a large city, you need to determine the best features to use in a model. You can choose standard metrics provided to measure performance before and after the feature importance process completes. You must ensure that the distribution of the features across multiple training models is consistent.
Data visualization
You need to provide the test results to the Fabrikam Residences team. You create data visualizations to aid in presenting the results.
You must produce a Receiver Operating Characteristic (ROC) curve to conduct a diagnostic test evaluation of the model. You need to select appropriate methods for producing the ROC curve in Azure Machine Learning Studio to compare the Two-Class Decision Forest and the Two-Class Decision Jungle modules with one another.


質問 # 91
Azure Machine Learning Studioで実験を作成します。 10,000行を含むトレーニングデータセットを追加します。最初の9,000行はクラス0(90パーセント)を表します。
残りの1,000行はクラス1(10パーセント)を表します。
トレーニングセットは、2つのクラス間の不均衡です。 5つのデータ行を使用して、クラス1のトレーニング例の数を4,000に増やす必要があります。 Synthetic Minority Oversampling Technique(SMOTE)モジュールを実験に追加します。
モジュールを構成する必要があります。
どの値を使用する必要がありますか?回答するには、回答領域のダイアログボックスで適切なオプションを選択します。
注:それぞれの正しい選択には1ポイントの価値があります。

正解:

解説:

説明

ボックス1:300
300(%)と入力すると、モジュールは元のデータセット(1000)と比較して少数派の割合(3000)を3倍にします。
ボックス2:5
5つのデータ行を使用する必要があります。
[最近傍の数]オプションを使用して、SMOTEアルゴリズムが新しいケースを構築するときに使用する機能空間のサイズを決定します。最近傍とは、あるターゲットケースに非常によく似たデータ行(ケース)です。任意の2つのケース間の距離は、すべてのフィーチャの加重ベクトルを組み合わせて測定されます。
最近傍の数を増やすことで、より多くのケースからフィーチャを取得できます。
最近傍の数を少なく保つことにより、元のサンプルの機能に似た機能を使用します。
参照:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/smote


質問 # 92
開発環境を整えます。Tensorflow フレームワークを使用し、推定器を使用してトレーニング スクリプトを送信することにより、ディープ ニューラル ネットワーク (DNN) をトレーニングすることを計画しています。
トレーニング実行の計算速度を最適化する必要があります。
使用する適切な推定器と、適切なトレーニング コンピューティング ターゲット構成を選択する必要があります。
どの値を使用する必要がありますか? 回答するには、回答エリアで適切なオプションを選択します。
注: それぞれの正しい選択は 1 ポイントの価値があります。

正解:

解説:

Explanation

Box 1: Tensorflow
TensorFlow represents an estimator for training in TensorFlow experiments.
Box 2: 12 vCPU, 112 GB memory..,2 GPU,..
Use GPUs for the deep neural network.
Reference:
https://docs.microsoft.com/en-us/python/api/azureml-train-core/azureml.train.dnn


質問 # 93
統計分布で非対称性を分析しています。
次の画像には、2つのデータセットの確率分布を示す2つの密度曲線が含まれています。

ドロップダウンメニューを使用して、グラフィックに表示される情報に基づいて各質問に回答する回答選択肢を選択します。
注:それぞれの正しい選択には1ポイントの価値があります。

正解:

解説:

説明

Box 1: Positive skew
Positive skew values means the distribution is skewed to the right.
Box 2: Negative skew
Negative skewness values mean the distribution is skewed to the left.
参照:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/compute-elementary-statistics


質問 # 94
あなたはワイナリーのデータサイエンティストとして雇われています。以前のデータサイエンティストはAzureMachineLearningを使用していました。
モデルを確認し、各モデルがどのように決定を下すかを説明する必要があります。
どの説明モジュールを使用する必要がありますか?回答するには、回答領域で適切なオプションを選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。

正解:

解説:

Explanation:
Meta explainers automatically select a suitable direct explainer and generate the best explanation info based on the given model and data sets. The meta explainers leverage all the libraries (SHAP, LIME, Mimic, etc.) that we have integrated or developed. The following are the meta explainers available in the SDK:
Tabular Explainer: Used with tabular datasets.
Text Explainer: Used with text datasets.
Image Explainer: Used with image datasets.
Box 1: Tabular
Box 2: Text
Box 3: Image
Reference:
https://medium.com/microsoftazure/automated-and-interpretable-machine-learning-d07975741298


質問 # 95
Azure Machine Learning Studio を使用してバイナリ分類モデルを作成します。
モデルを評価するには、受信者動作特性 (RO C) 曲線と F1 スコアを使用する必要があります。
必要なビジネス指標を作成する必要があります。
実験をどのように完了する必要がありますか? 回答するには、回答領域のダイアログ ボックスで適切なオプションを選択します。
注: 正しく選択するたびに 1 ポイントの価値があります。

正解:

解説:


質問 # 96
さまざまな都市の家の所有権に関する人口統計データを探索する予定です。データは、次の形式のCSVファイルです。
年齢、都市、収入、自宅所有者
21,Chicago,50000,0
35,Seattle,120000,1
23,Seattle,65000,0
45,Seattle,130000,1
18,Chicago,48000,0
データを探索して結果を記録するには、Azure Machine Learningワークスペースで実験を実行する必要があります。実験では、次の情報を記録する必要があります。
*データセット内の観測数
* home_ownerによる収入の箱ひげ図
*都市名と各都市の平均収入を含む辞書必要な情報をログに記録するには、実験の実行オブジェクトの適切なロギングメソッドを使用する必要があります。
どのようにコードを完成させる必要がありますか?回答するには、適切なコードセグメントを正しい場所にドラッグします。各コードセグメントは、1回、複数回、またはまったく使用しない場合があります。コンテンツを表示するには、ペイン間で分割バーをドラッグするか、スクロールする必要がある場合があります。
注:それぞれの正しい選択は1ポイントの価値があります。

正解:

解説:


質問 # 97
グローバルペナルティ検出モデルのサンプリング戦略を構築するには、Python言語を使用する必要があります。
コードセグメントをどのように完成させる必要がありますか?回答するには、回答エリアで適切なオプションを選択します。
注:それぞれの正しい選択には1ポイントの価値があります。

正解:

解説:

Explanation

Box 1: import pytorch as deeplearninglib
Box 2: ..DistributedSampler(Sampler)..
DistributedSampler(Sampler):
Sampler that restricts data loading to a subset of the dataset.
It is especially useful in conjunction with class:`torch.nn.parallel.DistributedDataParallel`. In such case, each process can pass a DistributedSampler instance as a DataLoader sampler, and load a subset of the original dataset that is exclusive to it.
Scenario: Sampling must guarantee mutual and collective exclusively between local and global segmentation models that share the same features.
Box 3: optimizer = deeplearninglib.train. GradientDescentOptimizer(learning_rate=0.10)


質問 # 98
ワークスペース内のデータと実験を操作するには、Azure Machine Learning SDKを使用する必要があります。
Python環境からワークスペースに接続するには、config.jsonファイルを構成する必要があります。
ワークスペースに接続するために、config.jsonファイルに追加する必要がある2つの追加パラメーターはどれですか。それぞれの正解がソリューションの一部を示しています。
注:それぞれの正しい選択は1ポイントの価値があります。

  • A. ログイン
  • B. キー
  • C. subscription_Id
  • D. 地域
  • E. resource_group

正解:C、D

解説:
Topic 1, Case Study
Overview
You are a data scientist in a company that provides data science for professional sporting events. Models will be global and local market data to meet the following business goals:
* Understand sentiment of mobile device users at sporting events based on audio from crowd reactions.
* Access a user's tendency to respond to an advertisement.
* Customize styles of ads served on mobile devices.
* Use video to detect penalty events.
Current environment
Requirements
* Media used for penalty event detection will be provided by consumer devices. Media may include images and videos captured during the sporting event and snared using social media. The images and videos will have varying sizes and formats.
* The data available for model building comprises of seven years of sporting event media. The sporting event media includes: recorded videos, transcripts of radio commentary, and logs from related social media feeds feeds captured during the sporting events.
* Crowd sentiment will include audio recordings submitted by event attendees in both mono and stereo Formats.
Advertisements
* Ad response models must be trained at the beginning of each event and applied during the sporting event.
* Market segmentation nxxlels must optimize for similar ad resporr.r history.
* Sampling must guarantee mutual and collective exclusivity local and global segmentation models that share the same features.
* Local market segmentation models will be applied before determining a user's propensity to respond to an advertisement.
* Data scientists must be able to detect model degradation and decay.
* Ad response models must support non linear boundaries features.
* The ad propensity model uses a cut threshold is 0.45 and retrains occur if weighted Kappa deviates from 0.1 +/-5%.
* The ad propensity model uses cost factors shown in the following diagram:

The ad propensity model uses proposed cost factors shown in the following diagram:

Performance curves of current and proposed cost factor scenarios are shown in the following diagram:

Penalty detection and sentiment
Findings
* Data scientists must build an intelligent solution by using multiple machine learning models for penalty event detection.
* Data scientists must build notebooks in a local environment using automatic feature engineering and model building in machine learning pipelines.
* Notebooks must be deployed to retrain by using Spark instances with dynamic worker allocation
* Notebooks must execute with the same code on new Spark instances to recode only the source of the data.
* Global penalty detection models must be trained by using dynamic runtime graph computation during training.
* Local penalty detection models must be written by using BrainScript.
* Experiments for local crowd sentiment models must combine local penalty detection data.
* Crowd sentiment models must identify known sounds such as cheers and known catch phrases. Individual crowd sentiment models will detect similar sounds.
* All shared features for local models are continuous variables.
* Shared features must use double precision. Subsequent layers must have aggregate running mean and standard deviation metrics Available.
segments
During the initial weeks in production, the following was observed:
* Ad response rates declined.
* Drops were not consistent across ad styles.
* The distribution of features across training and production data are not consistent.
Analysis shows that of the 100 numeric features on user location and behavior, the 47 features that come from location sources are being used as raw features. A suggested experiment to remedy the bias and variance issue is to engineer 10 linearly uncorrected features.
Penalty detection and sentiment
* Initial data discovery shows a wide range of densities of target states in training data used for crowd sentiment models.
* All penalty detection models show inference phases using a Stochastic Gradient Descent (SGD) are running too stow.
* Audio samples show that the length of a catch phrase varies between 25%-47%, depending on region.
* The performance of the global penalty detection models show lower variance but higher bias when comparing training and validation sets. Before implementing any feature changes, you must confirm the bias and variance using all training and validation cases.


質問 # 99
Azure Machine Learningを使用して機械学習モデルをトレーニングしています。トレーニングスクリプトをリモートで実行するコンピューティングターゲットが必要です。次のPythonコードを実行します。

正解:

解説:

Explanation:
Box 1: Yes
The compute is created within your workspace region as a resource that can be shared with other users.
Box 2: Yes
It is displayed as a compute cluster.
View compute targets
1. To see all compute targets for your workspace, use the following steps:
2. Navigate to Azure Machine Learning studio.
3. Under Manage, select Compute.
4. Select tabs at the top to show each type of compute target.

Box 3: Yes
min_nodes is not specified, so it defaults to 0.
Reference:
https://docs.microsoft.com/en-us/python/api/azureml-core/azureml.core.compute.amlcompute.amlcomputeprovisioningconfiguration
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-create-attach-compute-studio


質問 # 100
群衆感情モデルの評価戦略を定義する必要があります。
順番に実行する必要がある3つのアクションはどれですか?回答するには、適切なアクションをアクションのリストから回答エリアに移動し、正しい順序に並べます。

正解:

解説:

Explanation

Step 1: Define a cross-entropy function activation
When using a neural network to perform classification and prediction, it is usually better to use cross-entropy error than classification error, and somewhat better to use cross-entropy error than mean squared error to evaluate the quality of the neural network.
Step 2: Add cost functions for each target state.
Step 3: Evaluated the distance error metric.
References:
https://www.analyticsvidhya.com/blog/2018/04/fundamentals-deep-learning-regularization-techniques/


質問 # 101
一連のラベル付き写真を使用するマルチクラス画像分類の深層学習モデルがあります。次のコードを作成して、モデルをトレーニングするときにハイパーパラメーター値を選択します。

次の各ステートメントについて、ステートメントがtrueの場合は[はい]を選択します。それ以外の場合は、[いいえ]を選択します。
注:それぞれの正しい選択は1ポイントの価値があります。

正解:

解説:

Explanation

Box 1: Yes
Hyperparameters are adjustable parameters you choose to train a model that govern the training process itself.
Azure Machine Learning allows you to automate hyperparameter exploration in an efficient manner, saving you significant time and resources. You specify the range of hyperparameter values and a maximum number of training runs. The system then automatically launches multiple simultaneous runs with different parameter configurations and finds the configuration that results in the best performance, measured by the metric you choose. Poorly performing training runs are automatically early terminated, reducing wastage of compute resources. These resources are instead used to explore other hyperparameter configurations.
Box 2: Yes
uniform(low, high) - Returns a value uniformly distributed between low and high Box 3: No Bayesian sampling does not currently support any early termination policy.
Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters


質問 # 102
CSVファイルからテキストを前処理する予定です。 Azure Machine Learning Studioのデフォルトのストップワードリストをロードします。
次の要件を満たすように、テキストの前処理モジュールを構成する必要があります。
*単一の標準形式から複数の関連する単語を確認します。
*テキストからパイプ文字を削除します。
*情報検索を最適化するために単語を削除します。
どの3つのオプションを選択する必要がありますか?回答するには、回答エリアで適切なオプションを選択します。
注:それぞれの正しい選択には1ポイントの価値があります。

正解:

解説:

References:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/preprocess-text


質問 # 103
注:この質問は、同じシナリオを提示する一連の質問の一部です。シリーズの各質問には、記載された目標を達成する可能性のある独自のソリューションが含まれています。一部の質問セットには複数の正しい解決策がある場合もあれば、正しい解決策がない場合もあります。
このセクションの質問に回答すると、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
あなたはAzure Machine Learning Studioを使用しているデータサイエンティストです。
ターゲット列を予測するには、値を正規化して出力列をビンに生成する必要があります。
解決策:PQuantile正規化でQuantilesビニングモードを適用します。
ソリューションは目標を達成していますか?

  • A. いいえ
  • B. はい

正解:A

解説:
Use the Entropy MDL binning mode which has a target column.
Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/group-data-into-bins


質問 # 104
ローカル ワークステーションで Azure Machine Learning SDK を使用してモデルをトレーニングし、登録します。Python 3.6 と Visual Studio Code がワークステーションにインストールされています。
モデルを Azure Kubernetes Service (AKS) ベースの Web サービスとして運用環境にデプロイしようとすると、スコアリング スクリプトでエラーが発生し、デプロイが失敗します。
サービスを実稼働環境にデプロイする前に、ローカル ワークステーションでサービスをデバッグする必要があります。
どの 4 つのアクションを順番に実行する必要がありますか? 回答するには、アクションのリストから適切なアクションを回答領域に移動し、正しい順序で並べます。

正解:

解説:

Explanation
Graphical user interface, text, application, email Description automatically generated

Step 1: Install Docker on the workstation
Prerequisites include having a working Docker installation on your local system.
Build or download the dockerfile to the compute node.
Step 2: Create an AksWebservice deployment configuration and deploy the model to it To deploy a model to Azure Kubernetes Service, create a deployment configuration that describes the compute resources needed.
# If deploying to a cluster configured for dev/test, ensure that it was created with enough
# cores and memory to handle this deployment configuration. Note that memory is also used by
# things such as dependencies and AML components.
deployment_config = AksWebservice.deploy_configuration(cpu_cores = 1, memory_gb = 1) service = Model.deploy(ws, "myservice", [model], inference_config, deployment_config, aks_target) service.wait_for_deployment(show_output = True) print(service.state) print(service.get_logs()) Step 3: Create a LocalWebservice deployment configuration for the service and deploy the model to it To deploy locally, modify your code to use LocalWebservice.deploy_configuration() to create a deployment configuration. Then use Model.deploy() to deploy the service.
Step 4: Debug and modify the scoring script as necessary. Use the reload() method of the service after each modification.
During local testing, you may need to update the score.py file to add logging or attempt to resolve any problems that you've discovered. To reload changes to the score.py file, use reload(). For example, the following code reloads the script for the service, and then sends data to it.
Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-deploy-azure-kubernetes-service
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-troubleshoot-deployment-local


質問 # 105
別紙Aで指定された順序で処理する必要がある5つのPythonスクリプトを記述します。これにより、同じモジュールを並行して実行できますが、依存関係のあるモジュールを待ちます。
バージョン管理システムで追跡するパイプラインを作成するスクリプトを作成するため、Python SDKを使用してAzure Machine Learningパイプラインを作成する必要があります。 5つのPythonScriptStepを作成し、モジュール名と一致するように変数に名前を付けました。

表示されているパイプラインを作成する必要があります。関連するすべてのインポートが行われたと想定します。
どのPythonコードセグメントを使用する必要がありますか?

  • A. オプションB
  • B. オプションA
  • C. オプションC
  • D. オプションD

正解:B

解説:
The steps parameter is an array of steps. To build pipelines that have multiple steps, place the steps in order in this array.
Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-use-parallel-run-step


質問 # 106
......

更新されたのはMicrosoft DP-100日本語問題集PDFオンラインエンジン:https://www.goshiken.com/Microsoft/DP-100J-mondaishu.html